MetaやGoogleのAI安全対策がGitHub公開ツールで解除できるとの報告
記事のポイント
📰ニュース
MetaやGoogleのAIモデルに組み込まれた安全対策が、GitHubで公開されているツールで解除可能と報じられました。
🔍注目ポイント
オープンウェイトモデルの安全制御が、数分で容易に無効化できる脆弱性が指摘されています。
🔮これからどうなる
悪意あるユーザーがAIを悪用し、マルウェア作成や違法行為に繋がる情報を生成するリスクが高まります。
AIチャットボットは危険な質問への回答を拒否する安全制御を備えていますが、Financial TimesとAI安全団体Aliceのテストで、MetaやGoogleのオープンウェイトモデルからこの制御が解除できることが判明しました。
これは、AIの悪用を防ぐための対策が不十分である可能性を示唆しています。
これは、AIの悪用を防ぐための対策が不十分である可能性を示唆しています。
概要
AIチャットボットには、危険な依頼や違法行為につながる質問に答えないための「安全制御」が組み込まれています。たとえばマルウェア作成、生物兵器、児童性的虐待コンテンツといった内容についてAIは回答を拒否します。ところがFinancial TimesがAI安全団体のAliceと共同で行ったテストにより、MetaやGoogleなどが公開す…
オープンソースAIの安全対策が簡単に突破されるのは、私たちの生活に直結する大きな問題ですね。開発者は早急な対策が求められそうです。