言語モデルの「推論」における不確実性の追跡
言語モデルの推論過程で生成される中間トークン列の不確実性を分析し、正解予測に活用する研究が発表され…
言語モデルの推論過程で生成される中間トークン列の不確実性を分析し、正解予測に活用する研究が発表され…
特権情報(PI)を統合することで、表形式基盤モデル(TFM)の学習を加速し、汎化性能を向上させるPIQLフレ…
AIモデルの長期的推論における学習効率と信頼性を向上させる「Prune-OPD」という新しいフレームワークが発…
LLMが自己評価する際に、従来の「信頼度」だけでなく、多次元的な評価指標が性能予測に有効であることが示…
GazeVLMは、人間のようなアクティブビジョンを模倣し、内部アテンション制御で視覚情報を処理する新しいマ…
LLMエージェントがサイバー攻撃において特定の手法に偏る「攻撃選択バイアス」が発見されました。
MatryoshkaLoRAは、LLMのファインチューニングにおいて、効率と性能を両立させるための新しい低ランク適応…
大規模言語モデルのオンポリシー蒸留(OPD)の学習を安定させる新しい手法「vOPD」が提案されました。
深層ニューラルネットワークの学習過程における隠れ層の重みスペクトルの進化を理論的に解析しました。
動画理解の報酬モデル開発を促進するため、新しいベンチマークと大規模なデータセットが発表されました。
ストリーミング動画をリアルタイムで理解するAIモデルが、効率的な記憶管理と高い精度を両立する新フレー…
AI査読システムの評価における課題を解決するため、完全性と正確性を重視した新たなベンチマーク「CoCoRev…