CyberSecEval 2 - 大規模言語モデルのサイバーセキュリティリスクと能力を評価する包括的フレームワーク
LLMのサイバーセキュリティ能力とリスクを評価する新しいフレームワーク「CyberSecEval 2」が発表されまし…
AI&Tech、もう追いかけなくていい。
30秒で読めるニュースダイジェスト
LLMのサイバーセキュリティ能力とリスクを評価する新しいフレームワーク「CyberSecEval 2」が発表されまし…
OpenAIは汎用人工知能(AGI)の安全な開発と展開に向けた取り組みを公開しました。
LLMの長文生成能力を向上させるため、KVキャッシュの量子化手法が開発されました。
OpenAIの共同創設者でチーフサイエンティストのイリヤ・サツケバー氏が退社しました。
Googleがオープンな視覚言語モデル「PaliGemma」を公開しました。
Hugging Faceがアラビア語LLMの性能を評価する初のオープンリーダーボードを公開しました。
OpenAIがAIモデルの動作をユーザーが指定できる「Model Spec」を発表しました。
OpenAIが自社ツールで生成されたコンテンツを識別する新技術を発表しました。
ヘブライ語に特化した大規模言語モデル(LLM)の性能を評価するオープンリーダーボードが公開されました。
LLMの性能評価を行う「Artificial Analysis」のリーダーボードがHugging Face上で利用可能になりました。
コード生成AIモデルStarCoder2が、自己アライメント手法により性能を向上させました。
OpenAIが救命治療の開発加速に向けた取り組みを発表しました。