TopoPrune:統一された潜在空間トポロジーによる堅牢なデータ剪定
データ剪定手法「TopoPrune」が、潜在空間の摂動に強く、安定した性能を発揮します。
データ剪定手法「TopoPrune」が、潜在空間の摂動に強く、安定した性能を発揮します。
チェスの言語モデル「Mixture-of-Masters (MoM)」が、複数の世界クラスのグランドマスターのスタイルを模…
マルチモーダルAIにおける画像とテキスト表現の「モダリティギャップ」を解消する新しい学習手法が提案さ…
LLMの推論能力向上に用いられるRLVRにおいて、エントロピー崩壊を抑制する新しい制御メカニズムが提案され…
大規模言語モデル(LLM)のオフポリシー強化学習において、高い分散を抑え安定した学習を可能にする新手法…
強化学習において、言語モデルの推論能力向上を目的とした新しいデータサンプリング戦略「Goldilocks」が…
機械学習や組合せ最適化における非凸関数の最適化を統一的に扱う新しいフレームワークが提案されました。
スキーマ制約付きLLM生成のための大規模データセット「ScrapeGraphAI-100k」が公開されました。
LLMがマルチエージェント強化学習の新しいアルゴリズムを自動で発見しました。
LLMの倫理的選択が文脈によって大きく変化し、その隠れた構造が明らかになりました。
オフライン強化学習において、大規模または連続的な行動空間を持つパラメトリックポリシーの理論的保証が…
結腸直腸がんの薬物応答予測に、機械学習とLLMを統合した新しいAIフレームワークが開発されました。