信頼度認識アライメントで推論LLMの信頼性が向上
LLMが推論過程の信頼度を自己評価し、誤った中間ステップを修正する新手法が開発されました。
LLMが推論過程の信頼度を自己評価し、誤った中間ステップを修正する新手法が開発されました。
LLMがグラフデータ上で多段階推論を行うための「GraphReAct」フレームワークが提案されました。
表現力豊かな記述論理の概念学習において、有界適合という手法が実用的なアプローチとして有効であること…
マルチモーダルモデルの学習データ選択を効率化する「One-Step-Train(OST)」フレームワークが発表されま…
ビジョン言語モデル(VLM)の急速な発展と複雑化に対応するため、その概念と仕組みを体系的に解説する書籍…
LLMの内部表現が生成動作にどう影響するかを、補助プローブなしで直接操作する新手法が開発されました。
産業用ロボットの時系列データに基づき、機械理解を評価する新たなベンチマーク「FactoryBench」が発表さ…
大規模ソーシャルシミュレーションを高速化するハイブリッドフレームワーク「GASim」が発表されました。
LLMが階層的タスクネットワーク(HTN)プランニングのための効果的な探索ヒューリスティクスを生成できる…
可変次数マルコフモデルに正規制約を適用し、厳密な系列生成を可能にする新しい手法が開発されました。
LLMエージェントが未知のツール連携で推論する能力を測る「AgentEscapeBench」という新しいベンチマークが…
LLMマルチエージェントが協調プロトコルを自動生成・検証し、TLA+モデルチェッカーの反例で修復する手法が…