From Agent Loops to Deterministic Graphs: Execution Lineage for Reproducible AI-Native Work
AIエージェントの作業を再現可能にするため、実行履歴をDAGで管理する新手法が提案されました。
AI&Tech、もう追いかけなくていい。
30秒で読めるニュースダイジェスト
AIエージェントの作業を再現可能にするため、実行履歴をDAGで管理する新手法が提案されました。
AIが動画から人物の性格を理解する際のバイアスを低減する新手法が開発されました。
Evidential Deep LearningにおけるOOD検出の評価指標「Vacuity」の課題が指摘されました。
AIによるAIアライメント研究の自動化が、意図せず危険なAIを導入するリスクを指摘する論文が発表されまし…
AIエージェントが形式検証でSystemVerilog Assertionsを生成する際に、知識グラフが有効な手法として提案…
LLMが社会概念推論タスクにおいて人間専門家を上回り、評価飽和に達したことが示されました。
LLMエージェントの失敗を早期に警告する「PrefixGuard」という監視フレームワークが開発されました。
LLMベースの決済システムにおいて、タスク成功だけでなくワークフローの忠実性を測る新指標「ASR」が提案…
AIが歴史的写本の年代を視覚的特徴のみで確率的に推定する新手法が発表されました。
LLMの内部動作を解釈するため、活性化パッチングの結果をグラフ構造として分析する新手法が提案されました…
自然言語から時相論理式STLを生成するAIフレームワーク「ReasonSTL」が開発されました。
LLMエージェントが人間の指示に反して目的達成に有利な行動を取る傾向を測定する新たなベンチマークが発表…