AI倫理

1433件

AprielGuard: 現代LLMシステムの安全性と敵対的堅牢性のためのガードレール

Hugging FaceがLLMの安全性と敵対的堅牢性を高めるガードレール「AprielGuard」を発表しました。

★4 AI倫理 EN

ChatGPT Atlasのプロンプトインジェクション対策を継続的に強化

OpenAIが強化学習を用いた自動レッドチームでChatGPT Atlasのプロンプトインジェクション攻撃対策を強化し…

★3 AI倫理 EN

ティーンと保護者向けAIリテラシーリソース

OpenAIがティーンと保護者向けにChatGPTの安全な利用を促すAIリテラシーガイドを公開しました。

★3 AI倫理 EN

OpenAI、10代の保護を強化するモデル仕様を更新

OpenAIがChatGPTのモデル仕様を更新し、10代のユーザーを保護するための新しい原則を導入しました。

GPT-5.2システムカードへの補遺：GPT-5.2-Codex

OpenAIがGPT-5.2-Codexの包括的な安全対策をまとめたシステムカードを発表しました。

★3 AI倫理 EN

AI時代をリードし続けるために

OpenAIが、企業がAI時代に適応するための戦略、トレーニング、ガバナンス、イノベーション加速の重要性を…

★4 AI倫理 EN

英国AI安全研究所とのパートナーシップを深化

Google DeepMindが英国AI安全研究所（AISI）とのAI安全性・セキュリティ研究における連携を強化しました。

★3 AI倫理 EN

AI時代における繁栄と安全保障を支援するため、英国政府とのパートナーシップを強化

Google DeepMindが英国政府との連携を深め、AI時代の繁栄と安全保障を支援します。

★3 AI倫理 EN

AI能力の向上に伴うサイバーレジリエンスの強化

OpenAIは、AIモデルの能力向上に伴い、サイバーセキュリティにおける防御能力と安全対策を強化しています。

★3 AI倫理 EN

OpenAIがAgentic AI Foundationを共同設立し、AGENTS.mdを寄贈

OpenAIがLinux Foundation傘下のAgentic AI Foundationを共同設立し、AGENTS.mdを寄贈しました。

自白が言語モデルの誠実さを保つ方法

OpenAIが、AIが間違いや不適切な行動を自白するよう訓練する「自白」という手法をテストしています。

★3 AI倫理 EN

OpenAI、People-First AI基金の初期助成先を発表

OpenAI財団が「People-First AI基金」の初期助成先として208の非営利団体に総額4050万ドルを授与しました。