AI検索エージェントはウェブを調査するのではなく、既知の情報を確認する傾向がある
AI search agents often confirm what they already know instead of actually researching the web
記事のポイント
主要なAI検索エージェントが、ウェブを実際に調査するのではなく、学習済みの情報を確認していることが判明しました。
最新の出来事に関するベンチマークで、AIが記憶に頼れなくなると性能が大幅に低下し、既存のランキングが変動します。
AI検索の信頼性が疑問視され、ユーザーは最新情報や正確な調査結果を得るのが難しくなる可能性があります。
GPT-5.4やKimi K2.6などのモデルは、このベンチマークで記憶に頼れない状況になると、性能が著しく低下することが示されました。
概要
Leading AI search agents like GPT-5.4 and Kimi K2.6 don't appear to do much actual research on established benchmarks. They mostly just use the web to confirm what they already learned during training. Researchers at the Harbin Institute of Technology found this using a new time-based benchmark cal…
AI検索エージェントが最新情報を本当に調べているのか、それとも記憶に頼っているのか、この研究は私たちの情報収集のあり方に影響を与えそうです。日々のニュースの信頼性にも関わってきますね。