他のエージェントの学習プロセスを考慮しながら学習するAI

「他のエージェントの学習プロセスを考慮しながら学習する「LOLA(Learning with Opponent-Learning Awareness)」」に関する研究とのこと。

 

「囚人のジレンマ」の状況に対する選択結果が面白いです。