Maximizing Rollout Informativeness under a Fixed Budget: A Submodular View of Tree Search for Tool-Use Agentic Reinforcement Learning
ツール利用型AIエージェントの強化学習において、限られた予算内でロールアウトの有用性を最大化する新し…
AI&Tech、もう追いかけなくていい。
30秒で読めるニュースダイジェスト
ツール利用型AIエージェントの強化学習において、限られた予算内でロールアウトの有用性を最大化する新し…
LLMによるコード生成の品質問題が、訓練データに起因するメカニズムを体系的にレビューしました。
AIによる査読の外部委託を防ぐため、論文に隠された防御策「IntraGuard」が提案されました。
グラフの最大重み独立集合問題を高速に解く「Graph Normalization (GN)」という新しい動的システムが発表…
ViTok-v2が50億パラメータ規模の画像オートエンコーダとして、ネイティブ解像度での画像再構築性能を向上…
VLMが物理空間でプライバシーを認識する能力を評価する新しいフレームワークが開発されました。
スパースオートエンコーダ(SAE)の「特徴量飢餓」問題を解決する新しい手法が提案されました。
LLMを活用し、衛星画像から自然言語による多様な物体を検索する新手法「Open-SAT」が発表されました。
視覚障がい者向け音声解説作成で、AIが生成した高品質な下書きが作業効率と品質を向上させました。
学生がAI生成コンテンツへの反論を作成し、その評価をAIと人間で行う研究が実施されました。
GNNの所有権を検証し、模倣されたモデルを特定する新手法「CopyCop」が発表されました。
単眼動画からサウジアラビア手話の高品質な3Dアバターを生成する技術が開発されました。