言語モデルにおける認識論的観測可能性
主要な大規模言語モデルが、誤った情報を生成する際に最も高い自信を示すことが判明しました。
主要な大規模言語モデルが、誤った情報を生成する際に最も高い自信を示すことが判明しました。
大規模言語モデルの圧縮時に生じる誤差の伝播メカニズムを解明し、効率的な圧縮戦略を提案しました。
LLMの推論能力を向上させる「P^2O」という新しい学習手法が開発されました。
ニューラルネットワークの訓練における相転移現象が、パラメータ更新のグラム行列のスペクトルギャップに…
小規模なGPT-2モデルを使い、多言語環境での言語習得をシミュレートする研究が行われました。
新しい言語モデルアーキテクチャ「Multiscreen」が、従来のTransformerよりも効率的で安定した性能を示し…
MAT-Cellは、LLMとマルチエージェント推論を組み合わせ、単一細胞の自動アノテーション精度を向上させるフ…
フローモデルと拡散モデルの報酬ベース微調整手法を「報酬スコアマッチング(RSM)」という共通フレームワ…
単一のLLMが潜在空間内でエンコーディング、検索、生成を統合する新しいRAGフレームワーク「LAnR」が提案…
患者の臨床データにおける欠損モダリティを、自己回帰シーケンスモデリングとLLMの因果デコーダーで処理す…
AIエージェントが予測市場で取引し、分散した私的情報を集約する能力を実験で検証しました。
AIが科学教室における生徒と教師の発話を自動分析し、推論パターンを分類するシステムが開発されました。