LithoBench:リモートセンシング岩石解釈のための大規模マルチモーダルモデルのベンチマーク
リモートセンシングによる岩石解釈能力を評価する、専門家が注釈を付けた新しいベンチマーク「LithoBench…
AI&Tech、もう追いかけなくていい。
30秒で読めるニュースダイジェスト
リモートセンシングによる岩石解釈能力を評価する、専門家が注釈を付けた新しいベンチマーク「LithoBench…
LLMの推論能力を向上させるため、マルチエージェントによる検証・精緻化フレームワーク「MAVEN」が提案さ…
自動短文採点において、LLMは完璧な回答と誤った回答では高精度だが、中程度の回答で性能が低下することが…
自動運転システムが安全に機能するための運用設計ドメイン(ODD)知覚に、ビジョン言語モデル(VLM)をゼ…
インドの国家レベルの身元確認システム向けに、10億規模のマルチモーダル生体認証検索システム「Bharat AB…
AIエージェントの真実な報告を促すためのスコアリングルールにおいて、誤較正が内生的に発生する問題が指…
観光推薦システム(CRS)の評価ギャップを埋めるため、対話型推薦とレビュー引用証拠を組み合わせた新しい…
単一チャネル話者距離推定モデルが、室内の残響成分と録音条件にどのように依存するかを分析しました。
LLMエージェントが実世界の曖昧なポリシー下で意思決定する能力を評価する新しいベンチマーク「DRIP-R」が…
エンコーダー・デコーダー型トランスフォーマーの動作を新しい時相論理で特性評価する研究が発表されまし…
AIを主要な参加者とする大規模アジャイルソフトウェア開発の新しい原則と価値観が提唱されました。
長文コンテキスト推論において、CPUとGPUを連携させ、効率的な疎行列アテンションを実現する新手法「Fluxi…