因子集約を超えて:連合型LoRAのためのゲージ認識型低ランクサーバー表現
連合学習環境で大規模言語モデルを効率的に適応させる新しい手法「GLoRA」が提案されました。
連合学習環境で大規模言語モデルを効率的に適応させる新しい手法「GLoRA」が提案されました。
LLMベースの自律エージェントが、ハルシネーションなどの予測不能な失敗から自動的に回復するフレームワー…
GeoKANは、入力座標を学習された幾何学的に適応した座標に変換し、関数近似を行う新しいKANモデルです。
強化学習を用いたLLMの推論能力向上において、GXPOがGRPOより効率的に性能を改善しました。
強化学習において、Adam最適化アルゴリズムがストリーミング学習で効果的であることを発見しました。
VITA-QinYuは、ロールプレイングと歌唱の両方を生成できる初の表現豊かなエンドツーエンド音声言語モデル…
プロセス報酬モデル(PRM)の成功確率予測を、条件付き最適輸送を用いて較正する新手法が提案されました。
Adamなどの適応的勾配法が安定性の瀬戸際で動作する現象を、ロッドフローモデルを用いて説明する研究が発…
LLMの意図理解能力を評価する新しいベンチマーク「IntentGrasp」が発表されました。
LLMとシンボリック回帰を組み合わせ、自律顕微鏡実験から新しい物理モデルを生成するフレームワークが開発…
大規模言語モデル(LLM)の強化学習(RL)後学習において、KVキャッシュのメモリ消費を大幅に削減する新し…
自己回帰型言語モデルの内部表現を再利用し、拡散型言語モデルへの変換を加速する手法が提案されました。