DIRECT POLICY GRADIENTS: DIRECT OPTIMIZA TION OF POLICIES IN DISCRETE ACTION SPACES

Gespeichert in:

Bibliographische Detailangaben
Veröffentlicht in:	NeurIPS (34. : 2020 : Online) 34th Conference on Neural Information Processing Systems (NeurIPS 2020) ; Volume 22 of 27
1. Verfasser:	Lorberbom, Guy (VerfasserIn)
Weitere Verfasser:	Maddison, Chris J. (VerfasserIn), Heess, Nicolas (VerfasserIn), Hazan, Tamir (VerfasserIn), Tarlow, Daniel (VerfasserIn)
Pages:	34
Format:	UnknownFormat
Sprache:	eng
Veröffentlicht:	2021
Schlagworte:
Tags:	Tag hinzufügen Keine Tags, Fügen Sie den ersten Tag hinzu!

Beschreibung
Keine Beschreibung verfügbar.