Unifying Goal-Conditioned RL and Unsupervised Skill Learning via Control-Maximization
目標条件付き強化学習と教師なしスキル学習を「制御最大化」という概念で統一する理論が発表されました。
AI&Tech、もう追いかけなくていい。
30秒で読めるニュースダイジェスト
目標条件付き強化学習と教師なしスキル学習を「制御最大化」という概念で統一する理論が発表されました。
画像トークナイザーと自己回帰型事前モデルの学習を統合する新手法「wAR-Tok」が提案されました。
強化学習において、状態に応じて割引率を動的に調整する「AdaGamma」という新しい手法が開発されました。
オフライン強化学習において、データに依存する人気バイアスとサポート結合の問題を解決する新しいフレー…
画像とテキストの不一致を検出するモデルの性能を向上させる新しいデータセット「HNC」が提案されました。
Retina-RAGは、糖尿病性網膜症の重症度分類、黄斑浮腫検出、臨床レポート生成を同時に行うAIフレームワー…
信頼性の低い補助フィードバックを活用し、ブラックボックス最適化の効率を向上させる新しい手法が提案さ…
ロボットの動きを正確に予測し、視覚的に生成する新しいワールドモデル「EA-WM」が開発されました。
自己回帰型画像生成において、固定コードブックサイズが引き起こす「エントロピーの崖」問題を解決する新…
多変量回帰において、条件付きカバレッジを満たす最小体積の予測領域を直接構築する新しい数学的フレーム…
AI学習モデルが、正例と負例のペアから未知の仮説を識別・生成する新しい学習フレームワークが提案されま…
FunctionalAgentは、強相関分子系の電子エネルギー計算に用いるオン・トップ汎関数を自動開発するエージェ…