AprielGuard: 現代LLMシステムの安全性と敵対的堅牢性のためのガードレール
Hugging FaceがLLMの安全性と敵対的堅牢性を高めるガードレール「AprielGuard」を発表しました。
Hugging FaceがLLMの安全性と敵対的堅牢性を高めるガードレール「AprielGuard」を発表しました。
OpenAIが強化学習を用いた自動レッドチームでChatGPT Atlasのプロンプトインジェクション攻撃対策を強化し…
OpenAIがティーンと保護者向けにChatGPTの安全な利用を促すAIリテラシーガイドを公開しました。
OpenAIがChatGPTのモデル仕様を更新し、10代のユーザーを保護するための新しい原則を導入しました。
OpenAIがGPT-5.2-Codexの包括的な安全対策をまとめたシステムカードを発表しました。
OpenAIが、企業がAI時代に適応するための戦略、トレーニング、ガバナンス、イノベーション加速の重要性を…
Google DeepMindが英国AI安全研究所(AISI)とのAI安全性・セキュリティ研究における連携を強化しました。
Google DeepMindが英国政府との連携を深め、AI時代の繁栄と安全保障を支援します。
OpenAIは、AIモデルの能力向上に伴い、サイバーセキュリティにおける防御能力と安全対策を強化しています。
OpenAIがLinux Foundation傘下のAgentic AI Foundationを共同設立し、AGENTS.mdを寄贈しました。
OpenAIが、AIが間違いや不適切な行動を自白するよう訓練する「自白」という手法をテストしています。
OpenAI財団が「People-First AI基金」の初期助成先として208の非営利団体に総額4050万ドルを授与しました。