消費者向けCPUでのLitespark推論:三値ニューラルネットワーク向けカスタムSIMDカーネル
三値ニューラルネットワークの推論を消費者向けCPUで高速化するLitespark-Inferenceが開発されました。
三値ニューラルネットワークの推論を消費者向けCPUで高速化するLitespark-Inferenceが開発されました。
3D MRI画像を制御可能な2Dスライスシーケンスに変換し、その動きを予測する新しい自己教師あり学習手法が…
連続強化学習において、価値を保持する構造を自動で発見し、学習効率と安定性を向上させる新手法が提案さ…
言語モデルのファインチューニングにおいて、メンバーシップ推論攻撃に強い新しいプライバシー保護手法「P…
研究成果物には潜在的なセキュリティリスクが含まれており、その評価手法が提案されました。
Transformerベースの表形式基盤モデルの推論メカニズムを大規模に分析し、層ごとの冗長性を発見しました。
強化学習を用いて、二段階確率計画問題のベンダー分解におけるカット選択を最適化するフレームワークが提…
RLVR(検証可能な報酬による強化学習)が訓練データに暗黙的に過学習する現象が発見されました。
動画の背景を自然言語の指示で置き換えるための大規模データセットとモデル「Sparkle」が発表されました。
新しい言語モデル「Cola DLM」が、階層的な潜在拡散アプローチでテキスト生成の効率と品質を向上させまし…
協調型マルチエージェント強化学習の評価において、単なる結果だけでなく、エージェント間の協調メカニズ…
深層学習の最適化において、勾配の方向性の一貫性と損失収束が分離しうる現象が特定されました。