Policy Finetuning: Bridging Sample-Efficient Offline and Online Reinforcement Learning

Gespeichert in:
Bibliographische Detailangaben
Veröffentlicht in:NeurIPS (35. : 2021 : Online) 35th Conference on Neural Information Processing Systems (NeurIPS 2021) ; Volume 33 of 36
1. Verfasser: Xie, Tengyang (VerfasserIn)
Weitere Verfasser: Jiang, Nan (VerfasserIn), Wang, Huan (VerfasserIn), Xiong, Caiming (VerfasserIn), Bai, Yu (VerfasserIn)
Pages:35
Format: UnknownFormat
Sprache:eng
Veröffentlicht: 2022
Schlagworte:
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!