★4 AI倫理 EN OpenAI Blog by Synapse Flow 編集部

敵対的サンプルによる機械学習への攻撃

Attacking machine learning with adversarial examples

記事のポイント

📰ニュース

機械学習モデルを誤動作させるよう意図的に設計された入力「敵対的サンプル」について解説。

🔍注目ポイント

人間には正常に見えるが、AIには誤認識させる入力を作成する技術がポイント。

🔮これからどうなる

AIシステムの信頼性が低下し、自動運転やセキュリティなど重要分野での誤作動リスクが高まる。

敵対的サンプルは、機械学習モデルに対する一種の錯覚を引き起こす入力です。
攻撃者はこのサンプルを設計し、モデルに意図しない間違いを犯させます。
この現象は様々な媒体で確認されており、システムを敵対的サンプルから保護することが難しい理由についても議論されています。
💡
編集部の視点

敵対的サンプルって、AIの弱点をつく面白い現象だよね。見た目は普通なのにAIだけ騙されちゃうなんて、まるでAI版のイリュージョンみたい!

概要

Adversarial examples are inputs to machine learning models that an attacker has intentionally designed to cause the model to make a mistake; they’re like optical illusions for machines. In this post we’ll show how adversarial examples work across different mediums, and will discuss why securing sys…

元記事を読む →

関連記事