「他のエージェントの学習プロセスを考慮しながら学習する「LOLA(Learning with Opponent-Learning Awareness)」」に関する研究とのこと。 「囚人のジレンマ」の状況に対する選択結果が面白いです。
引用をストックしました
引用するにはまずログインしてください
引用をストックできませんでした。再度お試しください
限定公開記事のため引用できません。