TeamBench:役割分離下でのエージェント協調を評価する新ベンチマーク
役割分離が強制された環境下でのAIエージェントの協調能力を評価する新ベンチマーク「TeamBench」が発表さ…
AI&Tech、もう追いかけなくていい。
30秒で読めるニュースダイジェスト
役割分離が強制された環境下でのAIエージェントの協調能力を評価する新ベンチマーク「TeamBench」が発表さ…
化学反応の実現性を予測するAIエージェントフレームワーク「ARMOR」が開発されました。
時系列知識グラフ(TKG)の推論において、エンティティの表現を動的に更新する新手法「AdaTKG」が提案され…
LLMの課題を克服し、複雑な企業データから自律的にビジネス洞察を発見するフレームワーク「AIDA」が提案さ…
大規模言語モデル(LLM)を活用し、NP困難な組み合わせ最適化問題を解くための新しいマルチエージェントフ…
エージェントの記憶システムにおいて、古い情報が残存し、将来の行動に影響を与える問題を解決する新手法…
LLMを用いた環境シミュレーションの精度を評価し、幻覚や論理的矛盾を低減する新しいベンチマーク「EnvSim…
LLMが化学反応の調達コストを正確に計算できるかを評価する新しいベンチマーク「ChemCost」が発表されまし…
大規模視覚言語モデルのマルチモーダル推論能力を向上させる新しい強化学習手法が提案されました。
LLMベースのエージェントがマルチエージェント環境で対戦相手の行動を正確に予測する新しいフレームワーク…
AIエージェントの記憶が、無関係な情報が増えるにつれていつまで使えるかを評価する新しいプロトコルが提…
強化学習で訓練されたLLMの推論において、不必要に長い応答を短縮しつつ精度を維持・向上させる新手法が提…