PIIGuard: 敵対的サニタイズ下での個人識別情報(PII)収集を軽減するウェブページレベルの防御策
PIIGuard: Mitigating PII Harvesting under Adversarial Sanitization
記事のポイント
📰ニュース
LLMアシスタントによるウェブページからの個人識別情報(PII)収集を防ぐ新しい防御策「PIIGuard」が発表されました。
🔍注目ポイント
ウェブページに最適化された隠しHTMLフラグメントを埋め込み、LLMがPIIをそのまま開示しないよう誘導する技術です。
🔮これからどうなる
ウェブサイトの所有者が、LLMによるPIIの不正な収集からユーザーの個人情報を保護できるようになります。
PIIGuardは、ルールベースの漏洩スコアリング、進化的変異、最終的な判定者による回復可能性評価を用いてフラグメントのテキストと挿入位置を最適化します。
GPT-5.4-nano、Claude-haiku-4.5、DeepSeek-chat(latest v3.2)の3つのモデルで97.0%以上の防御成功率を達成し、通常のQA機能は維持されます。
公開URLブラウジングや攻撃者側のLLMサニタイズといったより困難な状況でも、一部のモデルと位置の組み合わせで効果が持続することが示されました。
GPT-5.4-nano、Claude-haiku-4.5、DeepSeek-chat(latest v3.2)の3つのモデルで97.0%以上の防御成功率を達成し、通常のQA機能は維持されます。
公開URLブラウジングや攻撃者側のLLMサニタイズといったより困難な状況でも、一部のモデルと位置の組み合わせで効果が持続することが示されました。
LLMがウェブから個人情報を収集するリスクは高まる一方なので、ウェブサイト側で対策できるPIIGuardのような技術は、私たちのプライバシー保護に大きく貢献しそうです。