Towards Security-Auditable LLM Agents: A Unified Graph Representation
LLMエージェントのセキュリティ監査を可能にする統一グラフ表現「Agent-BOM」が提案されました。
LLMエージェントのセキュリティ監査を可能にする統一グラフ表現「Agent-BOM」が提案されました。
マルチエージェント強化学習において、エージェント間の協調にランダム性が必要な場合があることが示され…
生成AIモデルの認知能力を人間と比較し、世代間の進化を評価する新しい心理測定フレームワークが提案され…
LLMの推論過程から探索木を抽出し、その計画が人間と異なり近視眼的であることを明らかにしました。
LLMが最も単純な長連鎖推論タスクである同値類問題でどの程度機能するかを評価しました。
言語モデルエージェントが固定のオーケストレータープログラムなしに、自己生成したプログラムでタスクを…
LLMエージェントがタスクを階層的に分解し、再利用可能なポリシーを学習する新手法が開発されました。
LLMの推論プロセスを監視可能にする「行動キュー推論」が開発されました。
LLMエージェントが複雑な環境で効率的に情報を収集するための新しいフレームワークが提案されました。
役割分離が強制された環境下でのAIエージェントの協調能力を評価する新ベンチマーク「TeamBench」が発表さ…
化学反応の実現性を予測するAIエージェントフレームワーク「ARMOR」が開発されました。
時系列知識グラフ(TKG)の推論において、エンティティの表現を動的に更新する新手法「AdaTKG」が提案され…