AVERAGE-REWARD OFF-POLICY POLICY EVALUATION WITH FUNCTION APPROXIMATION

Gespeichert in:
Bibliographische Detailangaben
Veröffentlicht in:International Conference on Machine Learning (38. : 2021 : Online) International Conference on Machine Learning (ICML 2021 ; Part 16 of 16
1. Verfasser: ZHANG, SHANGTONG (VerfasserIn)
Weitere Verfasser: WAN, YI (VerfasserIn), SUTTON, RICHARD S. (VerfasserIn), WHITESON, SHIMON (VerfasserIn)
Pages:2021
Format: UnknownFormat
Sprache:eng
Veröffentlicht: 2022
Schlagworte:
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Keine Beschreibung verfügbar.