LoRAと完全ファインチューニングの先へ:勾配誘導型オプティマイザルーティングによるLLM適応
LLMのファインチューニングにおいて、LoRAと完全ファインチューニングの利点を組み合わせる新手法が提案さ…
AI&Tech、もう追いかけなくていい。
30秒で読めるニュースダイジェスト
LLMのファインチューニングにおいて、LoRAと完全ファインチューニングの利点を組み合わせる新手法が提案さ…
ニューラルネットワークを用いたハミルトン・ヤコビ・ベルマン方程式の安定化ソルバーが開発されました。
シンプルなグラフヒューリスティックが、シーケンシャル推薦の既存ベンチマークで最新モデルを上回る性能…
LLMベースの推薦システムにおいて、協調的行動とアイテムメタデータを活用し、ランキング品質を最大化する…
グラフ異常検知(GAD)モデルが、大規模グラフ、極端な異常の希少性、ノード属性の欠損といった現実世界の…
WebエージェントがWebページを理解する際の観測空間の粒度を、要素レベルから機能領域レベルに再構築する…
LLMの推論能力向上を目指し、誤った推論ステップへの罰則を動的に調整する新しい強化学習手法が提案されま…
大規模言語モデルの推論を小規模モデルへ効率的に蒸留する新手法「D-RPC」が提案されました。
骨格データから人間の行動を認識するAIモデルの解釈性を高める新しいフレームワークが発表されました。
Qwen3-VL-Segは、言語指示に基づいて画像内の特定の領域をピクセルレベルで高精度にセグメンテーションす…
LLMが形式的数学ライブラリMathlibのプルリクエスト(PR)レビューを支援できるかを評価するベンチマーク…
都市の2D意味変化と3D高さ変化を同時に高精度で検出する新手法DPG-CDが発表されました。