★4 LLM EN arXiv cs.AI 2026年5月11日 13:00 by Synapse Flow 編集部

メモリ効率の高いループ型Transformer：ループ型言語モデルにおける計算とメモリの分離

Memory-Efficient Looped Transformer: Decoupling Compute from Memory in Looped Language Models

記事のポイント

📰ニュース

ループ型LLMのメモリ消費を大幅に削減する新アーキテクチャ「MELT」が発表されました。

🔍注目ポイント

MELTは、ループ型LLMのKVキャッシュを層ごとに共有し、学習可能なゲーティング機構で更新することで、推論深度とメモリ消費を分離します。

🔮これからどうなる

より深い推論を少ないメモリで実行できるようになり、高性能なAIモデルの利用が拡大する可能性があります。

従来のループ型LLMは、推論の反復回数が増えるにつれてメモリ消費が線形に増加し、実用的なスケーラビリティが課題でした。
MELTは、この問題を解決するため、標準のKVキャッシュを層ごとに共有し、学習可能なゲーティング機構で更新する新しいアプローチを採用しています。
これにより、Ouroなどの既存モデルと比較して劇的に少ないメモリで同等以上の性能を発揮します。

💡

編集部の視点

これはすごいですね。ループ型LLMのメモリ問題が解決されれば、より複雑な推論を可能にするAIモデルが、私たちの身近なデバイスでも利用できるようになるかもしれません。

元記事を読む →