Foresighted policy gradient reinforcement learning: solving large-scale social dilemmas with rational altruistic punishment

Gespeichert in:
Bibliographische Detailangaben
1. Verfasser: Hoen, Pieter Jan 't (VerfasserIn)
Weitere Verfasser: Bohte, Sander M. (VerfasserIn), Poutré, J. Han La (VerfasserIn)
Format: UnknownFormat
Sprache:eng
Veröffentlicht: Amsterdam Centrum voor Wiskunde en Informatica 2008
Schriftenreihe:Report SEN / Centrum voor Wiskunde en Informatica, Software Engineering 0804
Schlagworte:
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Beschreibung:[18] S.
graph. Darst.