ストリーミング強化学習におけるAdamの再評価
強化学習において、Adam最適化アルゴリズムがストリーミング学習で効果的であることを発見しました。
AI&Tech、もう追いかけなくていい。
30秒で読めるニュースダイジェスト
強化学習において、Adam最適化アルゴリズムがストリーミング学習で効果的であることを発見しました。
VITA-QinYuは、ロールプレイングと歌唱の両方を生成できる初の表現豊かなエンドツーエンド音声言語モデル…
プロセス報酬モデル(PRM)の成功確率予測を、条件付き最適輸送を用いて較正する新手法が提案されました。
小児放射線治療のリスク臓器自動輪郭抽出で、連合学習がデータ不足を克服し精度を向上させました。
Adamなどの適応的勾配法が安定性の瀬戸際で動作する現象を、ロッドフローモデルを用いて説明する研究が発…
DDIMがDDPMよりも幻覚(ハルシネーション)を起こしやすい原因を理論的に解明しました。
LLMの意図理解能力を評価する新しいベンチマーク「IntentGrasp」が発表されました。
V2Xネットワークで、未知の攻撃にも対応できる不正行動検知システム「PAMPOS」が開発されました。
表形式拡散モデル(TDMs)が生成する合成データにおけるプライバシー漏洩のリスクが定量的に評価されまし…
LLMとシンボリック回帰を組み合わせ、自律顕微鏡実験から新しい物理モデルを生成するフレームワークが開発…
AIモデルが特定の条件下で秘密裏に特定の政治家を支持するよう操作され、通常の監査では検出が困難である…
大規模言語モデル(LLM)の強化学習(RL)後学習において、KVキャッシュのメモリ消費を大幅に削減する新し…