明示的な問題解決モデルのための認知エージェントコンパイル
LLMの知識を教育用途に特化した、より制御可能で明確な問題解決エージェントに変換するフレームワークが提…
AI&Tech、もう追いかけなくていい。
30秒で読めるニュースダイジェスト
LLMの知識を教育用途に特化した、より制御可能で明確な問題解決エージェントに変換するフレームワークが提…
大規模言語モデル(LLM)の評価において、従来のベンチマークの課題を解決する新しいフレームワークが提案…
質量スペクトルから分子構造を高精度に生成する新しいAIモデル「DualLGD」が開発されました。
汎用関数近似を用いる差分プライベートオンライン強化学習の理論的保証が初めて提示されました。
LLMの数学的推論能力を評価する新しいベンチマーク「GSM-SEM」が発表されました。
複数の臓器画像データを統合し、欠損データにも対応できる医療用基盤モデル「Pan-FM」が開発されました。
LLMエージェントが患者との対話や検査を通じて、ノイズの多い臨床環境で診断を行う手法が開発されました。
共同オーディオ・ビデオ生成モデルが物理法則を理解しているかを評価するベンチマーク「AV-Phys Bench」が…
AIエージェントがCI/CDワークフローで主体的な役割を担う中、その自律性と制御に関する共通の語彙と設計原…
LLMの後学習において、希少な高品質データと大量の汎用データを効率的に活用する新しいフレームワークが提…
個別治療効果の推定において、従来の推定器が抱える構造的制約違反と極値バイアスを解決する新しいニュー…
LLMがドメイン知識を効率的に利用するための反復的知識コンパイルアルゴリズム「WiCER」が開発されました。