宝くじではなく競争:勾配降下法がネットワークの能力をタスクに適応させる仕組みを理解する
勾配降下法がニューラルネットワークの理論的容量をタスクに適合する実効容量に削減するメカニズムが解明…
勾配降下法がニューラルネットワークの理論的容量をタスクに適合する実効容量に削減するメカニズムが解明…
トランスフォーマーがパリティ問題を解くために必要な最小層数が2層であることを証明しました。
AIによるテスト駆動型コード生成のメカニズムを確率論的枠組みで分析しました。
ロボットの行動予測において、過去の自己受容感覚に基づき行動を生成する新しい手法が開発されました。
自律型機械学習エンジニアリングにおいて、エージェントの行動停滞を克服する新しい強化学習フレームワー…
マルチモーダルLLMが複雑な推論タスクで生成する情報の信頼性を評価する新しいベンチマークが発表されまし…
縦断的な電子カルテデータから将来の臨床イベントを予測する新しいAIフレームワーク「Risk Horizons」が発…
Visual Para-Thinkerは、画像理解において並列推論を導入する初のマルチモーダルLLMフレームワークです。
セマンティック通信の効率を最大化するため、情報理論に基づいた新しいフレームワークが提案されました。
量子アニーリングコンピュータと生成AIを組み合わせ、訓練データを超える創薬候補分子を設計する新しいフ…
ヒューマノイドロボットが、視覚情報に基づき複雑な障害物コースでパルクールを自律的に実行しました。
医療時系列データ分析において、Transformerの分散型アテンションが抱える課題を解決する新モジュール「Co…