勾配外挿に基づく方策最適化(GXPO)
強化学習を用いたLLMの推論能力向上において、GXPOがGRPOより効率的に性能を改善しました。
AI&Tech、もう追いかけなくていい。
30秒で読めるニュースダイジェスト
強化学習を用いたLLMの推論能力向上において、GXPOがGRPOより効率的に性能を改善しました。
3Dレイアウト生成において、相対的な空間関係の推論精度と一貫性を向上させる新しいフレームワークR$^3$L…
ブドウの遺伝子型から表現型を予測する新しいAIモデル「LiT-G2P」が開発されました。
強化学習において、Adam最適化アルゴリズムがストリーミング学習で効果的であることを発見しました。
VITA-QinYuは、ロールプレイングと歌唱の両方を生成できる初の表現豊かなエンドツーエンド音声言語モデル…
プロセス報酬モデル(PRM)の成功確率予測を、条件付き最適輸送を用いて較正する新手法が提案されました。
小児放射線治療のリスク臓器自動輪郭抽出で、連合学習がデータ不足を克服し精度を向上させました。
Adamなどの適応的勾配法が安定性の瀬戸際で動作する現象を、ロッドフローモデルを用いて説明する研究が発…
DDIMがDDPMよりも幻覚(ハルシネーション)を起こしやすい原因を理論的に解明しました。
LLMの意図理解能力を評価する新しいベンチマーク「IntentGrasp」が発表されました。
V2Xネットワークで、未知の攻撃にも対応できる不正行動検知システム「PAMPOS」が開発されました。
表形式拡散モデル(TDMs)が生成する合成データにおけるプライバシー漏洩のリスクが定量的に評価されまし…