エージェント型出版:思考する大規模言語モデル時代の科学出版再設計
大規模言語モデル(LLM)を活用し、論文を対話型知識システムに変える「エージェント型出版」の概念が提案…
AI&Tech、もう追いかけなくていい。
30秒で読めるニュースダイジェスト
大規模言語モデル(LLM)を活用し、論文を対話型知識システムに変える「エージェント型出版」の概念が提案…
LLMベースのエージェントが外部ツールを使用する際の原則として、「認識論的に必要な場合のみ」という基準…
ベンチャーキャピタル分野で創業者の成功を予測する初のLLM向けベンチマーク「VCBench」が発表されました。
LLMエージェントが長期的タスクで計画と実行を分離する新しい階層的学習フレームワーク「HiMAC」が開発さ…
LLMなどの汎用AIエージェントの非推移的な相互作用を評価する新しいフレームワークが発表されました。
AIエージェントが自律的に行動すべきか、助けを求めるべきかを判断する能力を測る新しいベンチマーク「HiL…
LLMエージェントが実際のハードウェアバグを修正する能力を評価する大規模ベンチマーク「HWE-Bench」が発…
言語モデルが多様な推論戦略を探索し、より正確な応答を生成する新しい学習フレームワーク「Poly-EPO」が…
再帰的なLLMループが安定したパターンから別の状態へ移行するために必要なテキスト量と、その移行の持続性…
小規模LLMが自身の回答の正確性をゼロショットで推定する手法が、教師あり学習のベースラインを上回る性能…
人間脳にヒントを得た継続学習アルゴリズムが、スパイクニューラルネットワーク(SNN)の効率的なタスク学…
深層学習の最適化アルゴリズム「Muon」向けに、GPUに最適化された高速な極分解計算手法「Polar Express」…