Sparse Prefix Caching for Hybrid and Recurrent LLM Serving
LLM推論のレイテンシを削減する「Sparse Prefix Caching」という新しいキャッシュ手法が提案されました。
LLM推論のレイテンシを削減する「Sparse Prefix Caching」という新しいキャッシュ手法が提案されました。
生成AIの振る舞いを制御する新しい理論的枠組み「MidSteer」が発表されました。
Transformerモデルがトークンごとに計算深度を適応させる新手法「Token-Selective Attention (TSA)」が発…
陶磁器釉薬の特性予測と画像生成のための大規模データセット「GlazyBench」が発表されました。
AIコ・マセマティシャンは、数学者の研究を支援する対話型AIワークベンチです。
Sparse Autoencoder(SAE)における特徴合成の構造的不安定性を幾何学的フレームワークで分析しました。
AIモデルの不正学習を防ぐ「学習不能な例(UE)」が、事前学習・ファインチューニングの環境で効果が薄れ…
マルチモーダルMoEモデルの推論効率を向上させるMACSフレームワークが発表されました。
推論のための強化学習において、結果のみのフィードバックからプロセスレベルの学習信号を自動生成する新…
LLMの学習において、データ選別をオンラインで動的に重み付けする新手法「ADAPT」が提案されました。
量子化された深層学習モデルの精度を、進化的ファインチューニングで向上させる研究が発表されました。
ソフトロボットが絡まりを回避する新しい強化学習制御フレームワークが提案されました。