Microsoft ResearchのMirage、動画生成に持続的な空間記憶をもたらす
Microsoft Research's Mirage gives video generation a persistent spatial memory that doesn't forget what's around the corner
記事のポイント
Microsoft Researchが開発したMirageは、動画生成において空間の一貫性を保つ新しい世界モデルです。
ピクセルベースの点群ではなく潜在空間にシーン情報を保存することで、計算時間とグラフィックメモリを大幅に削減します。
長時間のカメラ移動でもシーンの空間的一貫性を維持し、よりリアルで効率的な動画生成が可能になります。
これにより、従来の動画生成モデルが抱えていた、カメラが移動するとシーンの整合性が失われる問題を解決します。
ただし、セグメントをまたぐ動く物体の追跡はまだ課題として残っています。
概要
Mirage, a video world model from Microsoft Research and several universities, stores scene information directly in latent space instead of pixel-based point clouds. That slashes compute time and graphics memory while keeping scenes spatially consistent through long camera moves. It still can't reli…
この技術は、映画制作やゲーム開発における仮想空間の構築を大きく変える可能性を秘めていますね。あなたの動画編集ももっとスムーズになるかもしれません。