人間とAIの共進化と認識崩壊:動的システムからの視点
人間とAIが相互作用するシステムにおいて、AIへの過度な依存が知識の多様性を低下させる可能性が指摘され…
AI&Tech、もう追いかけなくていい。
30秒で読めるニュースダイジェスト
人間とAIが相互作用するシステムにおいて、AIへの過度な依存が知識の多様性を低下させる可能性が指摘され…
敵対的防御の評価において、メモリ効率を向上させつつ、より正確なフル勾配攻撃を可能にする新フレームワ…
AIモデルが未知のデータ(分布シフト)に遭遇した際の性能低下を改善する新しい学習フレームワーク「eX2L…
COVID-19パンデミック中のフェイクニュース検出に、テキストおよび言語的特徴を用いた機械学習アプローチ…
言語モデルのファインチューニングにおいて、メンバーシップ推論攻撃に強い新しいプライバシー保護手法「P…
AIの画像認識モデルがなぜ特定の予測をするのかを、人間が理解しやすい高レベルな概念で説明する新手法が…
ラベル付きベンチマークがない状況で、LLMの安全性を比較評価する手法が提案・検証されました。
信頼できないAIの展開プロトコルを評価する「AI制御ゲーム」という形式的な意思決定モデルが提案されまし…
差分プライバシーを保証する合成テキスト生成の統一評価フレームワーク「SynBench」が発表されました。
AIエージェントの安全性課題に対し、プログラミング言語ベースの「安全ハーネス」を提案しました。
自律エージェントの評価における既存の課題を解決するため、人間が検証した300のタスクを含む新しい評価ス…
AIの安全性、バイアス、法的問題を解決するため、オークションベースの新しい規制メカニズムが提案されま…