Image GPT
Image GPT
記事のポイント
📰ニュース
OpenAIが言語モデルと同じTransformerで画像を生成・補完できることを発見しました。
🔍注目ポイント
大規模Transformerモデルがピクセルシーケンス学習で、言語モデル同様に一貫した画像を生成できる点です。
🔮これからどうなる
教師なし学習で画像認識の高性能な特徴抽出が可能になり、様々な画像AI開発に貢献します。
言語モデルと同じTransformerアーキテクチャを画像ピクセルシーケンスに適用することで、自然な画像生成や補完を実現しました。
生成品質と画像分類精度に相関があることを示し、最良の生成モデルが教師なし設定でトップの畳み込みネットワークに匹敵する特徴を持つことを証明しています。
生成品質と画像分類精度に相関があることを示し、最良の生成モデルが教師なし設定でトップの畳み込みネットワークに匹敵する特徴を持つことを証明しています。
概要
We find that, just as a large transformer model trained on language can generate coherent text, the same exact model trained on pixel sequences can generate coherent image completions and samples. By establishing a correlation between sample quality and image classification accuracy, we show that o…
言語モデルと同じ仕組みで画像もいけるってすごいよね!Transformerの汎用性の高さが改めて示された感じだね。