複数LLMルーティングにおける「解決不能の天井」:評価アーティファクトの実証研究
複数LLMルーティングの「解決不能の天井」が、評価方法の偏りによって過大評価されていることが判明しまし…
AI&Tech、もう追いかけなくていい。
30秒で読めるニュースダイジェスト
複数LLMルーティングの「解決不能の天井」が、評価方法の偏りによって過大評価されていることが判明しまし…
教師モデルの出力のみで学生モデルを効率的に学習させる新しい手法「ROPD」が開発されました。
LLMを用いたソフトウェア工学コミュニティの心理的安全性に関する定性分析において、プロンプト戦略がLLM…
AIエージェントが投稿・コメント・投票するReddit風プラットフォーム「Moltbook」のデータセットが公開さ…
LLM駆動の適応型内部脅威が、従来の検出システムを欺く「検出反転」を引き起こすことがシミュレーションで…
LLMから特定の記憶内容を選択的に削除する、リテインセット不要な新しい忘却手法「SHRED」が開発されまし…
ニューラルネットワークが訓練データ外(OOD)のデータに対して汎化できない原因を特定する研究が発表され…
ハイパーリンク構造を活用し、RAGシステムの回答品質と効率を向上させる新戦略「LARAG」が発表されました。
タンパク質言語モデルの性能を向上させる新しい学習手法「masked-position MLM+JEPA」が開発されました。
ストリーミング動画からいつ応答すべきかを判断する新しいフレームワーク「Response-G1」が発表されました…
大規模言語モデルの強化学習において、モデル自身の内部状態を利用して報酬の価値を推定する新しい手法「P…
Transformer層の設計を因果エネルギー最小化という新しいフレームワークで再考し、効率的なパラメータ化を…