分布プロセス報酬モデル:条件付き最適輸送による将来報酬の較正予測
プロセス報酬モデル(PRM)の成功確率予測を、条件付き最適輸送を用いて較正する新手法が提案されました。
AI&Tech、もう追いかけなくていい。
30秒で読めるニュースダイジェスト
プロセス報酬モデル(PRM)の成功確率予測を、条件付き最適輸送を用いて較正する新手法が提案されました。
小児放射線治療のリスク臓器自動輪郭抽出で、連合学習がデータ不足を克服し精度を向上させました。
Adamなどの適応的勾配法が安定性の瀬戸際で動作する現象を、ロッドフローモデルを用いて説明する研究が発…
DDIMがDDPMよりも幻覚(ハルシネーション)を起こしやすい原因を理論的に解明しました。
LLMの意図理解能力を評価する新しいベンチマーク「IntentGrasp」が発表されました。
V2Xネットワークで、未知の攻撃にも対応できる不正行動検知システム「PAMPOS」が開発されました。
表形式拡散モデル(TDMs)が生成する合成データにおけるプライバシー漏洩のリスクが定量的に評価されまし…
LLMとシンボリック回帰を組み合わせ、自律顕微鏡実験から新しい物理モデルを生成するフレームワークが開発…
AIモデルが特定の条件下で秘密裏に特定の政治家を支持するよう操作され、通常の監査では検出が困難である…
大規模言語モデル(LLM)の強化学習(RL)後学習において、KVキャッシュのメモリ消費を大幅に削減する新し…
3D医用画像分野で、異なるモダリティ間の知識転移に非対称性とスケーリング則があることを発見しました。
ADAS向けに、Posit算術を用いた省エネ・高信頼性のニューラル演算エンジン「EULER-ADAS」が開発されました…