ESCAPING FROM ZERO GRADIENT: REVISITING ACTION-CONSTRAINED REINFORCEMENT LEARNING VIA FRANK-WOLFE POLICY OPTIMIZATION

Gespeichert in:

Bibliographische Detailangaben
Veröffentlicht in:	Conference on Uncertainty in Artificial Intelligence (37. : 2021 : Online) 37th Conference on Uncertainty in Artificial Intelligence (UAI 2021) ; Part 1 of 3
1. Verfasser:	Lin, Jyun-Li (VerfasserIn)
Weitere Verfasser:	Hung, Wei (VerfasserIn), Yang, Shang-Hsuan (VerfasserIn), Hsieh, Ping-Chun (VerfasserIn), Liu, Xi (VerfasserIn)
Pages:	37
Format:	UnknownFormat
Sprache:	eng
Veröffentlicht:	2022
Schlagworte:
Tags:	Tag hinzufügen Keine Tags, Fügen Sie den ersten Tag hinzu!

Keine Ergebnisse!