N
言語モデルの安全性と誤用に関する教訓
OpenAIが言語モデルの安全性と誤用対策に関する最新の知見を公開しました。
AI&Tech、もう追いかけなくていい。
30秒で読めるニュースダイジェスト
OpenAIが言語モデルの安全性と誤用対策に関する最新の知見を公開しました。
元米国下院議員ウィル・ハード氏がOpenAIの取締役に就任しました。
Hugging Faceが、AI開発における倫理的・社会的な影響を考慮する重要性を強調しました。
OpenAIが大規模言語モデル(LLM)の能力、限界、社会的影響について解説しました。
AIシステムの安全性などに関する主張の検証可能性を高める10のメカニズムをまとめた報告書が発表されまし…
OpenAIが深層強化学習の安全な探索を評価するベンチマークを公開しました。
OpenAIが、強化学習エージェントの安全性制約遵守を評価する環境「Safety Gym」を公開しました。
OpenAIがAIの安全性に関する業界協力のための4つの戦略を提唱しました。
OpenAIがニューロン間の相互作用を可視化する新技術「アクティベーションアトラス」を発表しました。
OpenAIが、AIの長期的な安全性研究に社会科学者の参加が不可欠だと提唱しました。
OpenAIが、複雑なタスクを人間が分解してAIに教える「反復増幅」というAI安全技術を提案しました。
AIエージェント同士を議論させ、人間が勝敗を判定することでAIの安全性を高める手法が提案されました。