N
AI開発における検証可能性の向上
AIシステムの安全性などに関する主張の検証可能性を高める10のメカニズムをまとめた報告書が発表されまし…
AIシステムの安全性などに関する主張の検証可能性を高める10のメカニズムをまとめた報告書が発表されまし…
OpenAIが深層強化学習の安全な探索を評価するベンチマークを公開しました。
OpenAIが、強化学習エージェントの安全性制約遵守を評価する環境「Safety Gym」を公開しました。
OpenAIがAIの安全性に関する業界協力のための4つの戦略を提唱しました。
OpenAIがニューロン間の相互作用を可視化する新技術「アクティベーションアトラス」を発表しました。
OpenAIが、AIの長期的な安全性研究に社会科学者の参加が不可欠だと提唱しました。
OpenAIが、複雑なタスクを人間が分解してAIに教える「反復増幅」というAI安全技術を提案しました。
AIエージェント同士を議論させ、人間が勝敗を判定することでAIの安全性を高める手法が提案されました。
OpenAIが、多様なバックグラウンドを持つ人々に深層学習の学習機会と奨学金を提供します。
AI技術の悪用方法と、その脅威を防ぎ軽減する方法を予測する論文が発表されました。
OpenAIがAIモデルの振る舞いを理解しやすくするための「解釈可能で教育的な例」を公開しました。
AIが人間の望む行動を、2つの選択肢からより良い方を選ぶだけで学習するアルゴリズムが開発されました。