OpenAI、AIスーパーコンピューターのボトルネック解消のためAMD、Broadcom、Intel、Microsoft、NVIDIAと共同でネットワークプロトコルを開発
OpenAI built a networking protocol with AMD, Broadcom, Intel, Microsoft, and NVIDIA to fix AI supercomputer bottlenecks
記事のポイント
📰ニュース
OpenAIが主要テック企業と協力し、AIスーパーコンピューターのデータ転送を高速化するオープンソースのネットワークプロトコル「MRC」を開発しました。
🔍注目ポイント
MRCは数百のパスでデータを同時転送し、GPU間接続に必要なスイッチ層を削減することで、電力とコストを大幅に削減します。
🔮これからどうなる
AIモデルの学習効率が向上し、より大規模で複雑なAIの開発が加速され、私たちの生活に役立つAIサービスがさらに進化するでしょう。
MRCは、AMD、Broadcom、Intel、Microsoft、NVIDIAといった業界大手と共同で開発されました。
このプロトコルは、10万以上のGPUを接続する際に、従来の3〜4層のスイッチ層を2層に削減できるのが特徴です。
既にOpenAIのStargateスーパーコンピューターで稼働しています。
このプロトコルは、10万以上のGPUを接続する際に、従来の3〜4層のスイッチ層を2層に削減できるのが特徴です。
既にOpenAIのStargateスーパーコンピューターで稼働しています。
これはAIスーパーコンピューターの性能を大きく引き上げる技術ですね。大規模AIモデルの学習コストが下がり、新しいAIサービスがもっと早く私たちの手元に届きそうです。