MAVEN:段階的認識監査を備えたマルチエージェント検証・精緻化ネットワーク
LLMの推論能力を向上させるため、マルチエージェントによる検証・精緻化フレームワーク「MAVEN」が提案さ…
LLMの推論能力を向上させるため、マルチエージェントによる検証・精緻化フレームワーク「MAVEN」が提案さ…
自動短文採点において、LLMは完璧な回答と誤った回答では高精度だが、中程度の回答で性能が低下することが…
LLMエージェントが実世界の曖昧なポリシー下で意思決定する能力を評価する新しいベンチマーク「DRIP-R」が…
エンコーダー・デコーダー型トランスフォーマーの動作を新しい時相論理で特性評価する研究が発表されまし…
長文コンテキスト推論において、CPUとGPUを連携させ、効率的な疎行列アテンションを実現する新手法「Fluxi…
ループ型LLMのメモリ消費を大幅に削減する新アーキテクチャ「MELT」が発表されました。
大規模言語モデル(LLM)が生成する幻覚が、科学論文の引用文献に大規模に浸透していることが判明しました…
生成モデルの再学習において、複数の報酬関数に基づく合成データの厳選がモデルの多様性崩壊を防ぐことが…
小規模言語モデルエージェントの推論能力を向上させる新しい蒸留フレームワーク「SOD」が開発されました。
イタリアのエンジニアリング社が開発したLLM「EngGPT2-16B-A3B」が、競合モデルと比較評価されました。
複数の損失項を持つモデルの事前学習において、勾配ベースの手法で損失の重みを効率的に調整する新技術が…
POETSは、計算効率の高いポリシーアンサンブルを用いて、不確実性を考慮したLLM最適化フレームワークです。