RL後学習におけるKVキャッシュ圧縮:メモリ効率の良いアライメントのためのシャドウマスク蒸留
大規模言語モデル(LLM)の強化学習(RL)後学習において、KVキャッシュのメモリ消費を大幅に削減する新し…
AI&Tech、もう追いかけなくていい。
30秒で読めるニュースダイジェスト
大規模言語モデル(LLM)の強化学習(RL)後学習において、KVキャッシュのメモリ消費を大幅に削減する新し…
自己回帰型言語モデルの内部表現を再利用し、拡散型言語モデルへの変換を加速する手法が提案されました。
スマートホームIoTデバイスを操作する音声アシスタント開発のため、MISTという新しいデータセットが公開さ…
AI生成テキストを高い精度で検出する新しい手法「MELD」が開発されました。
LLMエージェントが追加計算を必要とする状況を判断する既存手法の課題を特定し、新しい学習フレームワーク…
対数線形アテンションモデルの記憶減衰パラメータを、入力に応じて動的に学習する手法が提案されました。
MoodleにRAGを活用したAI教育アシスタントプラグインが開発されました。
分散型ネットワークでストリーミングデータに対応する時変最適化手法が提案されました。
RLHFにおけるf-ダイバージェンス正則化の統一理論的枠組みが開発されました。
VLMがテキストを画像として処理する際に、圧縮された画像から必要な部分のみを選択的に拡大するフレームワ…
AIを活用したベイズ生成モデリング手法「BGM-IV」が、非線形な因果関係の推定を可能にしました。
LLMの知識を教育用途に特化した、より制御可能で明確な問題解決エージェントに変換するフレームワークが提…