TDPROP: DOES ADAPTIVE OPTIMIZATION WITH JACOBI PRECONDITIONING HELP TEMPORAL DIFFERENCE LEARNING?

Gespeichert in:
Bibliographische Detailangaben
Veröffentlicht in:AAMAS (20. : 2021 : Online) 20th International Conference on Autonomous Agents and Multiagent Systems (AAMAS 2021) ; Volume 2 of 3
1. Verfasser: Romoff, Joshua (VerfasserIn)
Weitere Verfasser: Henderson, Peter (VerfasserIn), Kanaa, David (VerfasserIn), Bengio, Emmanuel (VerfasserIn), Touati, Ahmed (VerfasserIn), Bacon, Pierre- Luc (VerfasserIn), Pineau, Joelle (VerfasserIn)
Pages:20
Format: UnknownFormat
Sprache:eng
Veröffentlicht: 2021
Schlagworte:
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Keine Beschreibung verfügbar.