メモリ効率の高いループ型Transformer:ループ型言語モデルにおける計算とメモリの分離
ループ型LLMのメモリ消費を大幅に削減する新アーキテクチャ「MELT」が発表されました。
AI&Tech、もう追いかけなくていい。
30秒で読めるニュースダイジェスト
ループ型LLMのメモリ消費を大幅に削減する新アーキテクチャ「MELT」が発表されました。
大規模言語モデル(LLM)が生成する幻覚が、科学論文の引用文献に大規模に浸透していることが判明しました…
生成モデルの再学習において、複数の報酬関数に基づく合成データの厳選がモデルの多様性崩壊を防ぐことが…
小規模言語モデルエージェントの推論能力を向上させる新しい蒸留フレームワーク「SOD」が開発されました。
ドリフティング・フィールド・ポリシー(DFP)という、非ODEベースのワンステップ生成ポリシーが提案され…
イタリアのエンジニアリング社が開発したLLM「EngGPT2-16B-A3B」が、競合モデルと比較評価されました。
GPSデータが欠損・破損している場合でも、機械学習でトラックと貨物のマッチング精度を向上させました。
2025年初頭に実施された学生向けAIコーディングチャレンジで、AIツールが学習者の思考やスキルに与える影…
複数の損失項を持つモデルの事前学習において、勾配ベースの手法で損失の重みを効率的に調整する新技術が…
POETSは、計算効率の高いポリシーアンサンブルを用いて、不確実性を考慮したLLM最適化フレームワークです。
言語モデルの推論過程で生成される中間トークン列の不確実性を分析し、正解予測に活用する研究が発表され…
画像生成モデルの品質評価において、従来の指標の課題を解決する新しい評価フレームワーク「APEX」が発表…