Qwen3-VL-Seg: 視覚言語グラウンディングでオープンワールド参照セグメンテーションを実現
Qwen3-VL-Segは、言語指示に基づいて画像内の特定の領域をピクセルレベルで高精度にセグメンテーションす…
AI&Tech、もう追いかけなくていい。
30秒で読めるニュースダイジェスト
Qwen3-VL-Segは、言語指示に基づいて画像内の特定の領域をピクセルレベルで高精度にセグメンテーションす…
LLMが形式的数学ライブラリMathlibのプルリクエスト(PR)レビューを支援できるかを評価するベンチマーク…
都市の2D意味変化と3D高さ変化を同時に高精度で検出する新手法DPG-CDが発表されました。
DNAメチル化データから生物学的年齢を推定する新しいAIモデル「RelAge-GNN」が開発されました。
HyperEyesは、複数の情報を同時に検索できる並列マルチモーダル検索エージェントです。
単語の境界が破損したテキストに対するLLMの情報検出精度が、U字型の「テキストの不気味の谷」現象を示す…
事前学習済み画像モデルのデータセット蒸留において、計算コストを大幅に削減する新手法が提案されました。
ゲーミングチャットの有害なメッセージを6つのカテゴリに分類するタスクで、合成データ拡張を用いたLLMの…
大規模言語モデルの幻覚を、生成モデルとは別の小型オープンウェイトモデルの内部活性化を用いて検出する…
異種クライアントアーキテクチャを持つ分割型連合学習で、パーソナライゼーションと汎化のギャップを埋め…
EEGデータの前処理方法の選択が、深層学習モデルによる脳活動予測の信頼性を著しく低下させることを発見し…
画像生成の高速化技術「CASCADE」が開発され、最大3.6倍の高速化を達成しました。