Foresighted policy gradient reinforcement learning: solving large-scale social dilemmas with rational altruistic punishment

Gespeichert in:

Bibliographische Detailangaben
1. Verfasser:	Hoen, Pieter Jan 't (VerfasserIn)
Weitere Verfasser:	Bohte, Sander M. (VerfasserIn), Poutré, J. Han La (VerfasserIn)
Format:	UnknownFormat
Sprache:	eng
Veröffentlicht:	Amsterdam Centrum voor Wiskunde en Informatica 2008
Schriftenreihe:	Report SEN / Centrum voor Wiskunde en Informatica, Software Engineering 0804
Schlagworte:	Forschungsbericht
Tags:	Tag hinzufügen Keine Tags, Fügen Sie den ersten Tag hinzu!

Beschreibung
Beschreibung:	[18] S. graph. Darst.