Near-Optimal Regret for Adversarial MDP with Delayed Bandit Feedback

Gespeichert in:

Bibliographische Detailangaben
Veröffentlicht in:	NeurIPS (36. : 2022 : New Orleans, La.; Online) 36th Conference on Neural Information Processing Systems (NeurIPS 2022 ; Volume 43 of 50
1. Verfasser:	Jin, Tiancheng (VerfasserIn)
Weitere Verfasser:	Lancewicki, Tal (VerfasserIn), Luo, Haipeng (VerfasserIn), Mansour, Yishay (VerfasserIn), Rosenberg, Aviv (VerfasserIn)
Pages:	36
Format:	UnknownFormat
Sprache:	eng
Veröffentlicht:	2023
Schlagworte:
Tags:	Tag hinzufügen Keine Tags, Fügen Sie den ersten Tag hinzu!

Beschreibung
Keine Beschreibung verfügbar.