Near-Optimal Regret for Adversarial MDP with Delayed Bandit Feedback

Gespeichert in:
Bibliographische Detailangaben
Veröffentlicht in:NeurIPS (36. : 2022 : New Orleans, La.; Online) 36th Conference on Neural Information Processing Systems (NeurIPS 2022 ; Volume 43 of 50
1. Verfasser: Jin, Tiancheng (VerfasserIn)
Weitere Verfasser: Lancewicki, Tal (VerfasserIn), Luo, Haipeng (VerfasserIn), Mansour, Yishay (VerfasserIn), Rosenberg, Aviv (VerfasserIn)
Pages:36
Format: UnknownFormat
Sprache:eng
Veröffentlicht: 2023
Schlagworte:
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Keine Beschreibung verfügbar.