ESCAPING FROM ZERO GRADIENT: REVISITING ACTION-CONSTRAINED REINFORCEMENT LEARNING VIA FRANK-WOLFE POLICY OPTIMIZATION

Gespeichert in:
Bibliographische Detailangaben
Veröffentlicht in:Conference on Uncertainty in Artificial Intelligence (37. : 2021 : Online) 37th Conference on Uncertainty in Artificial Intelligence (UAI 2021) ; Part 1 of 3
1. Verfasser: Lin, Jyun-Li (VerfasserIn)
Weitere Verfasser: Hung, Wei (VerfasserIn), Yang, Shang-Hsuan (VerfasserIn), Hsieh, Ping-Chun (VerfasserIn), Liu, Xi (VerfasserIn)
Pages:37
Format: UnknownFormat
Sprache:eng
Veröffentlicht: 2022
Schlagworte:
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!