テキストの不気味の谷:LLM情報検索における非単調な性能劣化
単語の境界が破損したテキストに対するLLMの情報検出精度が、U字型の「テキストの不気味の谷」現象を示す…
AI&Tech、もう追いかけなくていい。
30秒で読めるニュースダイジェスト
単語の境界が破損したテキストに対するLLMの情報検出精度が、U字型の「テキストの不気味の谷」現象を示す…
事前学習済み画像モデルのデータセット蒸留において、計算コストを大幅に削減する新手法が提案されました。
ゲーミングチャットの有害なメッセージを6つのカテゴリに分類するタスクで、合成データ拡張を用いたLLMの…
大規模言語モデルの幻覚を、生成モデルとは別の小型オープンウェイトモデルの内部活性化を用いて検出する…
異種クライアントアーキテクチャを持つ分割型連合学習で、パーソナライゼーションと汎化のギャップを埋め…
EEGデータの前処理方法の選択が、深層学習モデルによる脳活動予測の信頼性を著しく低下させることを発見し…
画像生成の高速化技術「CASCADE」が開発され、最大3.6倍の高速化を達成しました。
LLMの長文コンテキスト推論におけるKVキャッシュのメモリと実行時オーバーヘッドを削減する新しい削除戦略…
異なるLLMが個別のパラメータを保ちつつ、経験を共有して同時に強化学習を行うフレームワークが提案されま…
画像解像度の低下が、マルチモーダルLLM(MLLM)の安全対策を容易に迂回させる脆弱性が発見されました。
無線フェデレーテッドラーニングにおいて、チャネル状態情報が不要な新しい集約手法「REED」が提案されま…
大規模言語モデルの層剪定による急激な性能低下のメカニズムが、決定表現の遷移を通じて解明されました。