CASCADE: Case-Based Continual Adaptation for Large Language Models During Deployment
LLMがデプロイ後も経験から学習し続ける「デプロイ時学習」のフレームワークが発表されました。
AI&Tech、もう追いかけなくていい。
30秒で読めるニュースダイジェスト
LLMがデプロイ後も経験から学習し続ける「デプロイ時学習」のフレームワークが発表されました。
LLMエージェントの記憶メカニズムの進化を「ストレージ」「リフレクション」「経験」の3段階で分類する調…
LLMが最終回答を生成する前に、いつ回答の意思決定が安定するかを分析する新しい理論が発表されました。
Weblicaは、視覚的なWebエージェントの訓練環境をスケーラブルかつ再現可能にするフレームワークです。
AIが物理学の推論を支援する際、批評と対話が成果にどう影響するかを研究しました。
LLMエージェントのセキュリティ監査を可能にする統一グラフ表現「Agent-BOM」が提案されました。
生成AIモデルの認知能力を人間と比較し、世代間の進化を評価する新しい心理測定フレームワークが提案され…
マルチエージェント強化学習において、エージェント間の協調にランダム性が必要な場合があることが示され…
LLMの推論過程から探索木を抽出し、その計画が人間と異なり近視眼的であることを明らかにしました。
AIエージェントが行動の実行可能性を動的に追跡する新しいワールドモデル「AGWM」が提案されました。
AIエージェントの性能を公平に比較するための統一ベンチマーク「Agentick」が発表されました。
LLMが最も単純な長連鎖推論タスクである同値類問題でどの程度機能するかを評価しました。