厳選された合成データは崩壊しない:多元的選好による生成モデル再学習の理論的研究
生成モデルの再学習において、複数の報酬関数に基づく合成データの厳選がモデルの多様性崩壊を防ぐことが…
AI&Tech、もう追いかけなくていい。
30秒で読めるニュースダイジェスト
生成モデルの再学習において、複数の報酬関数に基づく合成データの厳選がモデルの多様性崩壊を防ぐことが…
小規模言語モデルエージェントの推論能力を向上させる新しい蒸留フレームワーク「SOD」が開発されました。
イタリアのエンジニアリング社が開発したLLM「EngGPT2-16B-A3B」が、競合モデルと比較評価されました。
複数の損失項を持つモデルの事前学習において、勾配ベースの手法で損失の重みを効率的に調整する新技術が…
POETSは、計算効率の高いポリシーアンサンブルを用いて、不確実性を考慮したLLM最適化フレームワークです。
言語モデルの推論過程で生成される中間トークン列の不確実性を分析し、正解予測に活用する研究が発表され…
特権情報(PI)を統合することで、表形式基盤モデル(TFM)の学習を加速し、汎化性能を向上させるPIQLフレ…
AIモデルの長期的推論における学習効率と信頼性を向上させる「Prune-OPD」という新しいフレームワークが発…
LLMが自己評価する際に、従来の「信頼度」だけでなく、多次元的な評価指標が性能予測に有効であることが示…
GazeVLMは、人間のようなアクティブビジョンを模倣し、内部アテンション制御で視覚情報を処理する新しいマ…
LLMエージェントがサイバー攻撃において特定の手法に偏る「攻撃選択バイアス」が発見されました。
MatryoshkaLoRAは、LLMのファインチューニングにおいて、効率と性能を両立させるための新しい低ランク適応…