クロスアテンションとエンコーダー・デコーダー型トランスフォーマーの論理的特性評価
エンコーダー・デコーダー型トランスフォーマーの動作を新しい時相論理で特性評価する研究が発表されまし…
エンコーダー・デコーダー型トランスフォーマーの動作を新しい時相論理で特性評価する研究が発表されまし…
AIを主要な参加者とする大規模アジャイルソフトウェア開発の新しい原則と価値観が提唱されました。
長文コンテキスト推論において、CPUとGPUを連携させ、効率的な疎行列アテンションを実現する新手法「Fluxi…
ループ型LLMのメモリ消費を大幅に削減する新アーキテクチャ「MELT」が発表されました。
大規模言語モデル(LLM)が生成する幻覚が、科学論文の引用文献に大規模に浸透していることが判明しました…
生成モデルの再学習において、複数の報酬関数に基づく合成データの厳選がモデルの多様性崩壊を防ぐことが…
小規模言語モデルエージェントの推論能力を向上させる新しい蒸留フレームワーク「SOD」が開発されました。
ドリフティング・フィールド・ポリシー(DFP)という、非ODEベースのワンステップ生成ポリシーが提案され…
イタリアのエンジニアリング社が開発したLLM「EngGPT2-16B-A3B」が、競合モデルと比較評価されました。
GPSデータが欠損・破損している場合でも、機械学習でトラックと貨物のマッチング精度を向上させました。
2025年初頭に実施された学生向けAIコーディングチャレンジで、AIツールが学習者の思考やスキルに与える影…
複数の損失項を持つモデルの事前学習において、勾配ベースの手法で損失の重みを効率的に調整する新技術が…