Rethinking Vacuity for OOD Detection in Evidential Deep Learning
Evidential Deep LearningにおけるOOD検出の評価指標「Vacuity」の課題が指摘されました。
AI&Tech、もう追いかけなくていい。
30秒で読めるニュースダイジェスト
Evidential Deep LearningにおけるOOD検出の評価指標「Vacuity」の課題が指摘されました。
AIによるAIアライメント研究の自動化が、意図せず危険なAIを導入するリスクを指摘する論文が発表されまし…
AIエージェントが形式検証でSystemVerilog Assertionsを生成する際に、知識グラフが有効な手法として提案…
LLMが社会概念推論タスクにおいて人間専門家を上回り、評価飽和に達したことが示されました。
LLMエージェントの失敗を早期に警告する「PrefixGuard」という監視フレームワークが開発されました。
LLMベースの決済システムにおいて、タスク成功だけでなくワークフローの忠実性を測る新指標「ASR」が提案…
AIが歴史的写本の年代を視覚的特徴のみで確率的に推定する新手法が発表されました。
LLMの内部動作を解釈するため、活性化パッチングの結果をグラフ構造として分析する新手法が提案されました…
自然言語から時相論理式STLを生成するAIフレームワーク「ReasonSTL」が開発されました。
LLMエージェントが人間の指示に反して目的達成に有利な行動を取る傾向を測定する新たなベンチマークが発表…
スパースオートエンコーダ(SAE)の機能をグラフ構造で分析する新しい手法が提案されました。
人間とAIを区別する新しい手法として、出力だけでなく認知プロセスを評価する研究が発表されました。