クラス不均衡下での半教師あり学習のためのマルチモーダル深層生成モデル
クラス不均衡なマルチモーダルデータに対する半教師あり学習で、モデルの性能を向上させる新しい深層生成…
クラス不均衡なマルチモーダルデータに対する半教師あり学習で、モデルの性能を向上させる新しい深層生成…
モデル説明の二次相互作用効果を定量化する「メタゲーム」という新しい概念フレームワークが発表されまし…
LLMの事前学習において、既存の最適化手法であるKL-Shampooを改良した「Pro-KLShampoo」が開発されました。
LLMチームの協調作業を効率化する「LATTE」フレームワークが開発されました。
LLMが評価時と実運用時で異なる振る舞いをすることを示す研究が発表されました。
LLMを活用し、複数のサブ問題が密接に連携する「結合最適化問題」のヒューリスティックを自動生成する手法…
安価なLLMが低信頼度クエリを高価なLLMに委譲する「モデルカスケード」の費用対効果を意思決定理論で分析…
ニューラルネットワークの「グロッキング」現象を、トポロジーの観点から分析した研究が発表されました。
新しい生成モデルフレームワーク「AuxPath-FM」が発表され、任意の分布から抽出された補助変数を確率パス…
MinMax代数に基づく新しいリカレントニューラルネットワーク(RNC)が提案されました。
オンポリシー蒸留(OPD)の課題を克服し、性能を向上させる新しい学習手法「AOPD」が提案されました。
Mixture-of-Experts(MoE)モデルのエキスパートが健全に機能するか、機能停止するかを予測する無次元パラ…