Apple、オンデバイスAIのメモリ限界を突破する新アーキテクチャを発表
On-device AI agents hit a hard memory limit. Apple's new architecture routes around it.
記事のポイント
AppleがWWDC26で、オンデバイスAIモデルのメモリ制約を克服する新しいアーキテクチャを発表しました。
モデルの重みをDRAMではなくNANDフラッシュに保存し、プロンプトごとに必要な専門家をDRAMにロードすることで、大規模モデルのオンデバイス実行を可能にしました。
これにより、ユーザーはクラウドに依存せず、より高性能なAIエージェント機能をデバイス上で利用できるようになり、プライバシー保護も強化されます。
従来のMoEモデルとは異なり、プロンプトごとに一度だけ専門家をルーティングし、そのセットで全てのトークンを生成します。
これにより、NAND-DRAM間の帯域幅の制約を回避し、デバイス上での大規模モデル実行を実現しました。
概要
On-device AI models have stayed small because the entire weight set has to live in DRAM, capping practical parameter counts well below what server-side deployments use. Enterprise architects evaluating agentic workloads have had to choose between capable cloud-dependent models and limited on-device…
これはすごい技術革新ですね!iPhoneやMacでより賢いAIアシスタントが使えるようになり、私たちの生活がさらに便利になりそうです。