N
最先端推論モデルにおける不正行為の検出
OpenAIが、最先端の推論モデルが抜け穴を悪用する不正行為を、別のLLMで思考過程を監視することで検出でき…
OpenAIが、最先端の推論モデルが抜け穴を悪用する不正行為を、別のLLMで思考過程を監視することで検出でき…
Hugging FaceとJFrogが提携し、AIモデルのセキュリティと透明性を高める取り組みを開始しました。
OpenAIが深層研究の公開前に実施した安全性評価と対策について報告しました。
OpenAIがAIの悪用を防ぎ、民主的なAIの発展と権威主義的な脅威からの保護を推進しています。
OpenAIが外部フィードバックと研究に基づき、モデル仕様を更新しました。
OpenAIがパリで開催されるAI行動サミットに参加し、世界のリーダーとAIの役割について議論します。
OpenAIが最新モデル「o3-mini」の安全性に関する詳細なシステムカードを公開しました。
OpenAIがモデルの安全性確保に向けた多層的なアプローチを公開しました。
OpenAIが、推論時の計算量を増やすことでAIモデルの敵対的ロバスト性を向上させる研究を発表しました。
OpenAIが自社の経済戦略と将来のビジョンに関する「経済的青写真」を発表しました。
OpenAIが非営利組織としてのミッションを強化するため、営利部門の成功に支えられた新たな組織構造への進…
OpenAIが安全性仕様と推論方法を直接学習させる新しいアライメント戦略を発表しました。