Region4Web: Webエージェントの観測空間粒度再考
WebエージェントがWebページを理解する際の観測空間の粒度を、要素レベルから機能領域レベルに再構築する…
AI&Tech、もう追いかけなくていい。
30秒で読めるニュースダイジェスト
WebエージェントがWebページを理解する際の観測空間の粒度を、要素レベルから機能領域レベルに再構築する…
LLMの推論能力向上を目指し、誤った推論ステップへの罰則を動的に調整する新しい強化学習手法が提案されま…
大規模言語モデルの推論を小規模モデルへ効率的に蒸留する新手法「D-RPC」が提案されました。
骨格データから人間の行動を認識するAIモデルの解釈性を高める新しいフレームワークが発表されました。
Qwen3-VL-Segは、言語指示に基づいて画像内の特定の領域をピクセルレベルで高精度にセグメンテーションす…
LLMが形式的数学ライブラリMathlibのプルリクエスト(PR)レビューを支援できるかを評価するベンチマーク…
都市の2D意味変化と3D高さ変化を同時に高精度で検出する新手法DPG-CDが発表されました。
DNAメチル化データから生物学的年齢を推定する新しいAIモデル「RelAge-GNN」が開発されました。
HyperEyesは、複数の情報を同時に検索できる並列マルチモーダル検索エージェントです。
単語の境界が破損したテキストに対するLLMの情報検出精度が、U字型の「テキストの不気味の谷」現象を示す…
事前学習済み画像モデルのデータセット蒸留において、計算コストを大幅に削減する新手法が提案されました。
ゲーミングチャットの有害なメッセージを6つのカテゴリに分類するタスクで、合成データ拡張を用いたLLMの…