消費者向けCPUでのLitespark推論:三値ニューラルネットワーク向けカスタムSIMDカーネル
三値ニューラルネットワークの推論を消費者向けCPUで高速化するLitespark-Inferenceが開発されました。
AI&Tech、もう追いかけなくていい。
30秒で読めるニュースダイジェスト
三値ニューラルネットワークの推論を消費者向けCPUで高速化するLitespark-Inferenceが開発されました。
言語モデルのファインチューニングにおいて、メンバーシップ推論攻撃に強い新しいプライバシー保護手法「P…
RLVR(検証可能な報酬による強化学習)が訓練データに暗黙的に過学習する現象が発見されました。
新しい言語モデル「Cola DLM」が、階層的な潜在拡散アプローチでテキスト生成の効率と品質を向上させまし…
グラフ構造の類似度を測るグラフ編集距離(GED)を、ニューラルネットワークでより正確に推定する研究が発…
DINORANKCLIPは、CLIPの弱点を克服し、視覚言語モデルの性能を向上させる新しい事前学習フレームワークで…
大規模言語モデル(LLM)の性能を向上させる自己蒸留の統合フレームワーク「UniSD」が提案されました。
LLMで初期トークンがアテンションを独占する「アテンションシンク」現象の構造的起源が解明されました。
SignSGDがSGDよりも優れた性能を発揮する条件と理由を理論的に解明しました。
自己複製しサブタスクを委任する「再帰的エージェント」を強化学習で訓練する手法「RAO」が発表されました…
LLMエージェントの長期的な意思決定能力を向上させる新しい強化学習フレームワーク「StraTA」が発表されま…
LLMとコーパス統計を組み合わせ、多段階の探索的検索を単一の効率的な検索アクションに圧縮する「超知能検…