f-ダイバージェンス正則化RLHF:サンプリングと統一分析の二つの物語
RLHFにおけるf-ダイバージェンス正則化の統一理論的枠組みが開発されました。
AI&Tech、もう追いかけなくていい。
30秒で読めるニュースダイジェスト
RLHFにおけるf-ダイバージェンス正則化の統一理論的枠組みが開発されました。
AIエージェントが大規模なスキルライブラリから関連スキルを効率的に検索し、実行可能なコンテキストとし…
ニューラルネットワークの因果抽象化において、関連するニューロン部位を効率的に特定する新手法「PLOT」…
K平均クラスタリングが心理測定データにおいて、真の潜在的サブグループがなくても安定した結果を生成しう…
VLMがテキストを画像として処理する際に、圧縮された画像から必要な部分のみを選択的に拡大するフレームワ…
FlashMolは、わずか4ステップで高品質な3D分子構造を生成する超高速AIモデルです。
複数の脳アトラスから得られる機能的結合性データを用いて、脳障害の表現をアトラス間で一貫性を持って学…
AIを活用したベイズ生成モデリング手法「BGM-IV」が、非線形な因果関係の推定を可能にしました。
強化学習(RL)を用いたLLMのジェイルブレイク攻撃の成功要因が体系的に解明されました。
LLMの知識を教育用途に特化した、より制御可能で明確な問題解決エージェントに変換するフレームワークが提…
大規模言語モデル(LLM)の評価において、従来のベンチマークの課題を解決する新しいフレームワークが提案…
質量スペクトルから分子構造を高精度に生成する新しいAIモデル「DualLGD」が開発されました。