複数LLMルーティングにおける「解決不能の天井」:評価アーティファクトの実証研究
複数LLMルーティングの「解決不能の天井」が、評価方法の偏りによって過大評価されていることが判明しまし…
AI&Tech、もう追いかけなくていい。
30秒で読めるニュースダイジェスト
複数LLMルーティングの「解決不能の天井」が、評価方法の偏りによって過大評価されていることが判明しまし…
教師モデルの出力のみで学生モデルを効率的に学習させる新しい手法「ROPD」が開発されました。
ディープフェイク検出モデルが時間的攻撃に脆弱であることを明らかにし、その対策フレームワークを提案し…
GNSSが使えない都市部の複雑な環境で、低コストの慣性センサーのみでシェア自転車を正確に追跡する新技術…
ツール呼び出し型テキスト-to-イメージ(T2I)AIの安全性を脅かす新たなジェイルブレイク手法「OrchJail」…
LLMを用いたソフトウェア工学コミュニティの心理的安全性に関する定性分析において、プロンプト戦略がLLM…
物理情報学習を活用し、産業用撹拌槽内の流体流れを高速かつ少ないデータで予測する手法が開発されました。
VLMに対する敵対的攻撃を検出する軽量なフレームワーク「SAEgis」が開発されました。
AIエージェントが投稿・コメント・投票するReddit風プラットフォーム「Moltbook」のデータセットが公開さ…
物理シミュレーターを介入演算子として利用し、潜在的交絡因子が存在する環境で因果関係を発見する新手法…
LLM駆動の適応型内部脅威が、従来の検出システムを欺く「検出反転」を引き起こすことがシミュレーションで…
ロボットが分散された視覚-行動データから言語アノテーションなしで汎用的な視覚-言語-行動モデルを学習す…