AI倫理

N

★4 LLM EN

最先端推論モデルにおける不正行為の検出

OpenAIが、最先端の推論モデルが抜け穴を悪用する不正行為を、別のLLMで思考過程を監視することで検出でき…

★3 AI倫理 EN

Hugging FaceとJFrog、AIセキュリティの透明性向上で提携

Hugging FaceとJFrogが提携し、AIモデルのセキュリティと透明性を高める取り組みを開始しました。

N

★4 AI倫理 EN

深層研究システムカード

OpenAIが深層研究の公開前に実施した安全性評価と対策について報告しました。

N

★4 AI倫理 EN

AIの悪用を阻止する

OpenAIがAIの悪用を防ぎ、民主的なAIの発展と権威主義的な脅威からの保護を推進しています。

N

★3 LLM EN

OpenAI、パリAI行動サミットに参加

OpenAIがパリで開催されるAI行動サミットに参加し、世界のリーダーとAIの役割について議論します。

N

★3 AI倫理 EN

OpenAI o3-mini システムカード公開

OpenAIが最新モデル「o3-mini」の安全性に関する詳細なシステムカードを公開しました。

N

★4 AI倫理 EN

オペレーターシステムカード

OpenAIがモデルの安全性確保に向けた多層的なアプローチを公開しました。

N

★4 AI倫理 EN

推論時の計算と敵対的ロバスト性のトレードオフ

OpenAIが、推論時の計算量を増やすことでAIモデルの敵対的ロバスト性を向上させる研究を発表しました。

N

★4 AI倫理 EN

OpenAIの経済的青写真

OpenAIが自社の経済戦略と将来のビジョンに関する「経済的青写真」を発表しました。

N

★4 AI倫理 EN

OpenAIの構造はミッション推進のために進化しなければならない理由

OpenAIが非営利組織としてのミッションを強化するため、営利部門の成功に支えられた新たな組織構造への進…

N

★4 LLM EN

熟慮的アライメント：推論がより安全な言語モデルを可能にする

OpenAIが安全性仕様と推論方法を直接学習させる新しいアライメント戦略を発表しました。

最先端推論モデルにおける不正行為の検出

Hugging FaceとJFrog、AIセキュリティの透明性向上で提携

深層研究システムカード

AIの悪用を阻止する

最新モデル仕様の共有

OpenAI、パリAI行動サミットに参加

OpenAI o3-mini システムカード公開

オペレーターシステムカード

推論時の計算と敵対的ロバスト性のトレードオフ

OpenAIの経済的青写真

OpenAIの構造はミッション推進のために進化しなければならない理由

熟慮的アライメント：推論がより安全な言語モデルを可能にする