OPTIMISTIC POLICY OPTIMIZATION WITH BANDIT FEEDBACK

Gespeichert in:

Bibliographische Detailangaben
Veröffentlicht in:	International Conference on Machine Learning (37. : 2020 : Online) 37th International Conference on Machine Learning (ICML 2020) ; Part 12 of 15
1. Verfasser:	Efroni, Y. (VerfasserIn)
Weitere Verfasser:	Shani, L. (VerfasserIn), Rosenberg, A. (VerfasserIn), Mannor, S. (VerfasserIn)
Pages:	37
Format:	UnknownFormat
Sprache:	eng
Veröffentlicht:	2021
Schlagworte:
Tags:	Tag hinzufügen Keine Tags, Fügen Sie den ersten Tag hinzu!

Beschreibung
Keine Beschreibung verfügbar.