他者の心をモデル化する学習
Learning to model other minds
記事のポイント
📰ニュース
OpenAIが、相手も学習していることを考慮し、協力的な戦略を発見するアルゴリズム「LOLA」を発表しました。
🔍注目ポイント
相手の学習プロセスをモデル化することで、自己利益と協調性を両立する「しっぺ返し」戦略を自律的に学習します。
🔮これからどうなる
より高度な社会性を持つAIエージェントの開発に繋がり、人間との協調性が向上する可能性があります。
LOLA(Learning with Opponent-Learning Awareness)は、反復囚人のジレンマのような状況で、相手が学習していることを考慮に入れます。
これにより、単なる自己利益追求ではなく、相手の行動変化を予測し、協力的な「しっぺ返し」戦略を自律的に発見できる点が特徴です。
これは、他者の心をモデル化するAIの初期段階の成果と言えます。
これにより、単なる自己利益追求ではなく、相手の行動変化を予測し、協力的な「しっぺ返し」戦略を自律的に発見できる点が特徴です。
これは、他者の心をモデル化するAIの初期段階の成果と言えます。
概要
We’re releasing an algorithm which accounts for the fact that other agents are learning too, and discovers self-interested yet collaborative strategies like tit-for-tat in the iterated prisoner’s dilemma. This algorithm, Learning with Opponent-Learning Awareness (LOLA), is a small step towards agen…
相手の学習まで考慮に入れるってすごいね!これって、人間同士の駆け引きにも応用できそうだし、より賢いAIの第一歩って感じだね!