PROVABLY CONVERGENT TWO-TIMESCALE OFF-POLICY ACTOR-CRITIC WITH FUNCTION APPROXIMATION

Gespeichert in:
Bibliographische Detailangaben
Veröffentlicht in:International Conference on Machine Learning (37. : 2020 : Online) 37th International Conference on Machine Learning (ICML 2020) ; Part 15 of 15
1. Verfasser: Zhang, Shangtong (VerfasserIn)
Weitere Verfasser: Liu, Bo (VerfasserIn), Yao, Hengshuai (VerfasserIn), Whiteson, Shimon (VerfasserIn)
Pages:37
Format: UnknownFormat
Sprache:eng
Veröffentlicht: 2021
Schlagworte:
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Keine Beschreibung verfügbar.