正確で信頼できる人間レベルの推論における限界
AIシステムが正確性、信頼性、人間レベルの推論を同時に満たすことはできないと指摘する研究が発表されま…
AIシステムが正確性、信頼性、人間レベルの推論を同時に満たすことはできないと指摘する研究が発表されま…
連合学習環境で、データ・タスク・モダリティが異なるクライアント向けに基盤モデルをパーソナライズする…
LLMが関数合成タスクを解く際の内部メカニズムを解明する研究が発表されました。
スマートグリッドの通信傍受を検知する新しいAIモデルが開発されました。
深層学習モデルの予測根拠を説明する新しい帰属手法「FAMPE」が開発されました。
推論モデルの蒸留データにベンチマークデータが混入しているかを検出する手法が提案されました。
DINOv2が何を認識しているのかを解明するため、学習された概念辞書とミンコフスキー表現仮説を提案しまし…
LLMエージェントが自身の経験から学習し、問題解決戦略を反復的に改善するフレームワーク「EvolveR」が発…
LLMによるコード生成において、低品質なプロンプトがセキュリティ脆弱性を誘発するリスクを評価する研究が…
LLMが多ターン対話で関連情報のみを保持し、コンテキスト長を安定させる新しいエージェントフレームワーク…
LLMの最終トークン表現から元の入力テキストを再構築する新しいフレームワーク「Rep2Text」が提案されまし…
マルチモーダル合成画像の評価において、物理法則に基づいた新しいベンチマーク指標「PCMDE」が提案されま…