Reinforcement learning algorithms analysis and applications
Prediction Error and Actor-Critic Hypotheses in the Brain -- Reviewing on-policy / off-policy critic learning in the context of Temporal Differences and Residual Learning -- Reward Function Design in Reinforcement Learning -- Exploration Methods In Sparse Reward Environments -- A Survey on Constrainin...
Gespeichert in:
Weitere Verfasser: | , , , , |
---|---|
Format: | UnknownFormat |
Sprache: | eng |
Veröffentlicht: |
Cham, Switzerland
Springer Nature
2021
|
Schriftenreihe: | Studies in computational intelligence
volume 883 |
Schlagworte: | |
Online Zugang: | Cover Inhaltsverzeichnis |
Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Keine Ergebnisse!