ニューラルネットワーク訓練における相転移のスペクトルエッジダイナミクス:分析的・経験的研究
ニューラルネットワークの訓練における相転移現象が、パラメータ更新のグラム行列のスペクトルギャップに…
AI&Tech、もう追いかけなくていい。
30秒で読めるニュースダイジェスト
ニューラルネットワークの訓練における相転移現象が、パラメータ更新のグラム行列のスペクトルギャップに…
小規模なGPT-2モデルを使い、多言語環境での言語習得をシミュレートする研究が行われました。
新しい言語モデルアーキテクチャ「Multiscreen」が、従来のTransformerよりも効率的で安定した性能を示し…
StableTTAは、訓練不要なテスト時適応手法により、画像認識モデルの予測性能を向上させます。
MAT-Cellは、LLMとマルチエージェント推論を組み合わせ、単一細胞の自動アノテーション精度を向上させるフ…
拡散モデルのスペクトルバイアスを克服し、ゼロショット骨格動作認識の性能を向上させる新手法が発表され…
警察官のエスカレーション解除訓練を目的とした、実世界の警察と市民の対話データセット「DeEscalWild」が…
病理画像診断において、自己教師あり学習とハイブリッド状態空間モデルを組み合わせた「SSMamba」が開発さ…
フローモデルと拡散モデルの報酬ベース微調整手法を「報酬スコアマッチング(RSM)」という共通フレームワ…
単一のLLMが潜在空間内でエンコーディング、検索、生成を統合する新しいRAGフレームワーク「LAnR」が提案…
患者の臨床データにおける欠損モダリティを、自己回帰シーケンスモデリングとLLMの因果デコーダーで処理す…
オフポリシー強化学習において、批評家学習の過学習と不安定性を低ランク適応(LoRA)で解決する手法が提…