★4 画像生成 EN OpenAI Blog by Synapse Flow 編集部

Image GPT

Image GPT

記事のポイント

📰ニュース

OpenAIが言語モデルと同じTransformerで画像を生成・補完できることを発見しました。

🔍注目ポイント

大規模Transformerモデルがピクセルシーケンス学習で、言語モデル同様に一貫した画像を生成できる点です。

🔮これからどうなる

教師なし学習で画像認識の高性能な特徴抽出が可能になり、様々な画像AI開発に貢献します。

言語モデルと同じTransformerアーキテクチャを画像ピクセルシーケンスに適用することで、自然な画像生成や補完を実現しました。
生成品質と画像分類精度に相関があることを示し、最良の生成モデルが教師なし設定でトップの畳み込みネットワークに匹敵する特徴を持つことを証明しています。
💡
編集部の視点

言語モデルと同じ仕組みで画像もいけるってすごいよね!Transformerの汎用性の高さが改めて示された感じだね。

概要

We find that, just as a large transformer model trained on language can generate coherent text, the same exact model trained on pixel sequences can generate coherent image completions and samples. By establishing a correlation between sample quality and image classification accuracy, we show that o…

元記事を読む →

関連記事