LLMを概念習得シミュレーターとして用いた介入ベース時系列因果発見による数学的推論
LLMが数学的推論において、どの概念が正解に因果的に貢献するかを特定する新手法「CIKA」が提案されました…
AI&Tech、もう追いかけなくていい。
30秒で読めるニュースダイジェスト
LLMが数学的推論において、どの概念が正解に因果的に貢献するかを特定する新手法「CIKA」が提案されました…
心理的防衛メカニズムのレベルを分類するタスクで、多軸投票アンサンブルシステムが最高性能を達成しまし…
大規模言語モデル(LLM)の後学習プロセスが、人間行動との整合性を低下させることが判明しました。
リモートセンシングによる岩石解釈能力を評価する、専門家が注釈を付けた新しいベンチマーク「LithoBench…
LLMの推論能力を向上させるため、マルチエージェントによる検証・精緻化フレームワーク「MAVEN」が提案さ…
自動短文採点において、LLMは完璧な回答と誤った回答では高精度だが、中程度の回答で性能が低下することが…
LLMエージェントが実世界の曖昧なポリシー下で意思決定する能力を評価する新しいベンチマーク「DRIP-R」が…
エンコーダー・デコーダー型トランスフォーマーの動作を新しい時相論理で特性評価する研究が発表されまし…
長文コンテキスト推論において、CPUとGPUを連携させ、効率的な疎行列アテンションを実現する新手法「Fluxi…
ループ型LLMのメモリ消費を大幅に削減する新アーキテクチャ「MELT」が発表されました。
大規模言語モデル(LLM)が生成する幻覚が、科学論文の引用文献に大規模に浸透していることが判明しました…
生成モデルの再学習において、複数の報酬関数に基づく合成データの厳選がモデルの多様性崩壊を防ぐことが…