arXiv cs.AI 2026年5月8日 13:00 by Synapse Flow 編集部

Measuring Evaluation-Context Divergence in Open-Weight LLMs: A Paired-Prompt Protocol with Pilot Evidence of Alignment-Pipeline-Specific Heterogeneity

概要

arXiv:2605.06327v1 Announce Type: cross Abstract: Safety benchmarks are routinely treated as evidence about how a language model will behave once deployed, but this inference is fragile if behavior depends on whether a prompt looks like an evaluation. We define evaluation-context divergence as an o…

元記事を読む →

関連記事

★4 AI倫理 EN

マスク対アルトマン裁判第2週：OpenAIが反撃、マスクがサム・アルトマンを引き抜こうとした事実が明らかに

イーロン・マスク氏とOpenAIの裁判で、マスク氏がサム・アルトマン氏を引き抜こうとした過去が明かされま…

ファーウェイ、ビジュアル重視のメッシュWi-Fiルーター「HUAWEI WiFi Mesh X3 Pro」の一般販売決定

ファーウェイがクラウドファンディング先行販売のメッシュWi-Fiルーター「HUAWEI WiFi Mesh X3 Pro」の一…

ビジネス EN

オラクル解雇従業員が退職金交渉を試みるも拒否、一部は遠隔勤務のためWARN法保護対象外に

オラクルが解雇した従業員がより良い退職条件を求めて交渉を試みましたが、会社はこれを拒否しました。

★4 ビジネス EN

半導体株の急騰が市場を過去最高値に押し上げ

半導体株の急騰により、株式市場が過去最高値を更新しました。