フレームあたり1トークン:VLAポリシー向けワールドモデルにおける視覚帯域幅の再考
VLAモデルのワールドモデルにおいて、フレームごとの視覚情報を1つのセマンティックトークンに圧縮する手…
AI&Tech、もう追いかけなくていい。
30秒で読めるニュースダイジェスト
VLAモデルのワールドモデルにおいて、フレームごとの視覚情報を1つのセマンティックトークンに圧縮する手…
模倣学習における能動的視覚の性能を評価するための新しいベンチマーク「TAVIS」が発表されました。
量子着想型最適化手法が、機械学習における非凸最適化問題の解決に有効であることが示されました。
多発性硬化症(MS)の病変を、単一のAIモデルで横断的・縦断的に、かつ造影剤の有無に関わらず高精度にセ…
ニューラル事後推定を大規模な観測セットに適用する際の計算コスト問題を解決する新手法が発表されました。
言語モデルが将来のトークンを計画する内部表現をどこで形成し、それが生成を因果的に駆動するかを研究し…
LLM推論の最適な設定を見つけるためのプロファイリング時間を大幅に削減する新手法「Dooly」が発表されま…
AIシステムの評価方法論における「リンゴとオレンジ」のような比較を解消するため、標準化された評価シナ…
LLMが選択するツールがモデル内部で線形に読み取り可能かつ操作可能であることが判明しました。
グラフ構造ハイパーディメンショナルコンピューティング(PSP-HDC)が、少ないデータで複雑な3D微細構造の…
AIの機械的解釈可能性研究が因果関係を主張する際に、必要な識別仮定を明示していないことが指摘されまし…
スパイクニューラルネットワーク(SNN)の学習における、グローバル最適解を導く新しいアルゴリズムが提案…