ADAPTIVE TEMPORAL-DIFFERENCE LEARNING FOR POLICY EVALUATION WITH PER-STATE UNCERTAINTY ESTIMATES

Gespeichert in:
Bibliographische Detailangaben
Veröffentlicht in:NeurIPS (33. : 2019 : Vancouver, British Columbia) 32nd Conference on Neural Information Processing Systems (NeurIPS 2019) ; Volume 15 of 20
1. Verfasser: Riquelme, Carlos (VerfasserIn)
Weitere Verfasser: Penedones, Hugo (VerfasserIn), Vincent, Damien (VerfasserIn), Maennel, Hartmut (VerfasserIn), Gelly, Sylvain (VerfasserIn), Mann, Timothy A. (VerfasserIn), Barreto, Andre (VerfasserIn), Neu, Gergely (VerfasserIn)
Pages:32
Format: UnknownFormat
Sprache:eng
Veröffentlicht: 2020
Schlagworte:
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Keine Beschreibung verfügbar.