LLM

AI&Tech、もう追いかけなくていい。

30秒で読めるニュースダイジェスト

すべて LLM 画像生成ロボット AI倫理ビジネス研究セキュリティプロダクトその他

3260件

生成モデルの再学習において、複数の報酬関数に基づく合成データの厳選がモデルの多様性崩壊を防ぐことが…

小規模言語モデルエージェントの推論能力を向上させる新しい蒸留フレームワーク「SOD」が開発されました。

イタリアのエンジニアリング社が開発したLLM「EngGPT2-16B-A3B」が、競合モデルと比較評価されました。

複数の損失項を持つモデルの事前学習において、勾配ベースの手法で損失の重みを効率的に調整する新技術が…

POETSは、計算効率の高いポリシーアンサンブルを用いて、不確実性を考慮したLLM最適化フレームワークです。

言語モデルの推論過程で生成される中間トークン列の不確実性を分析し、正解予測に活用する研究が発表され…

特権情報（PI）を統合することで、表形式基盤モデル（TFM）の学習を加速し、汎化性能を向上させるPIQLフレ…

AIモデルの長期的推論における学習効率と信頼性を向上させる「Prune-OPD」という新しいフレームワークが発…

LLMが自己評価する際に、従来の「信頼度」だけでなく、多次元的な評価指標が性能予測に有効であることが示…

GazeVLMは、人間のようなアクティブビジョンを模倣し、内部アテンション制御で視覚情報を処理する新しいマ…

LLMエージェントがサイバー攻撃において特定の手法に偏る「攻撃選択バイアス」が発見されました。

MatryoshkaLoRAは、LLMのファインチューニングにおいて、効率と性能を両立させるための新しい低ランク適応…