RLVERを破れるか?強化学習で訓練された共感AIエージェントの敵対的堅牢性を探る
強化学習で訓練された共感AIエージェントの、敵対的なユーザー入力に対する堅牢性が評価されました。
強化学習で訓練された共感AIエージェントの、敵対的なユーザー入力に対する堅牢性が評価されました。
AIエージェントがシステム障害を診断・軽減するSREタスクの性能を評価する新しいベンチマーク「SREGym」が…
学習する監視者から真の目的地を隠すための、反復的な欺瞞的経路計画(RDPP)という新しい問題を提起しま…
消費者行動を統一的に捉え、マーケティング介入の効果を予測・評価する新しいAIモデルが提案されました。
LLMの課題を克服し、複雑な企業データから自律的にビジネス洞察を発見するフレームワーク「AIDA」が提案さ…
大規模言語モデル(LLM)を活用し、NP困難な組み合わせ最適化問題を解くための新しいマルチエージェントフ…
エージェントの記憶システムにおいて、古い情報が残存し、将来の行動に影響を与える問題を解決する新手法…
LLMを用いた環境シミュレーションの精度を評価し、幻覚や論理的矛盾を低減する新しいベンチマーク「EnvSim…
LLMが化学反応の調達コストを正確に計算できるかを評価する新しいベンチマーク「ChemCost」が発表されまし…
大規模視覚言語モデルのマルチモーダル推論能力を向上させる新しい強化学習手法が提案されました。
エージェント型コード修復において、弱フィードバック環境下でのGRPO性能を向上させる信号再形成手法が開…
LLMベースのエージェントがマルチエージェント環境で対戦相手の行動を正確に予測する新しいフレームワーク…