Chain of Risk: Safety Failures in Large Reasoning Models and Mitigation via Adaptive Multi-Principle Steering
大規模推論モデルの思考過程に潜在する安全上のリスクが明らかになりました。
AI&Tech、もう追いかけなくていい。
30秒で読めるニュースダイジェスト
大規模推論モデルの思考過程に潜在する安全上のリスクが明らかになりました。
Transformerモデルにおける記憶の競合と幻覚が、隠れ状態空間の「アトラクター幾何学」で説明されました。
LLMの出力がどの学習データに基づいているかを特定する新手法「DataDignity」が発表されました。
グラフ予測モデルGCCMが、対照学習と一貫性モデルを組み合わせ、既存手法の課題を克服しました。
LLMの推論効率を高める量子化手法において、汎化性能を向上させる新しいキャリブレーション手法が提案され…
LLM検索エージェントが推論時にツール利用とトークン生成の予算を効率的に制御する新手法が提案されました…
自己進化型検索エージェントが知識グラフパスを中間教師として活用し、性能を向上させました。
個別化医療における治療効果予測の精度向上を目指し、バイアスと精度のトレードオフを解決する新AI手法が…
マルチモーダルLLMの安全機構を回避する新しいジェイルブレイク攻撃手法が提案されました。
LLMの隠れ状態から線形に検出可能な失敗信号が、その失敗を修正できないことが示されました。
LLMエージェントシステムにおいて、多くのコンポーネントを組み合わせると性能が低下する「交差コンポーネ…
時系列データ異常検知に特化したマルチエージェントLLMフレームワーク「SAGE」が開発されました。