您的位置:首页 >报告称谷歌搜索AI概览准确率约90%
发布于2026-04-25 阅读(0)
扫一扫,手机访问
这事儿挺有意思。《纽约时报》最近发布了一篇报道,里面提到谷歌那个AI概览(AI Overviews)功能的准确率,大概在90%左右。乍一听,九成准确率好像还不错?别急,咱们来算笔账。谷歌每年的搜索量超过5万亿次,如果按照这个庞大的基数来推算,哪怕只有10%的失误,也意味着每小时可能会冒出超过5700万条错误答案——相当于每分钟接近100万条。这个数字背后的潜在影响,是不是就有点惊人了?
一家名为Oumi的AI初创公司,用SimpleQA基准对谷歌搜索做了次评估。他们分析了超过4300次搜索,结果发现,去年10月谷歌的Gemini 2模型,准确率大概是85%。到了今年2月,升级后的Gemini 3模型,把这个数字提升到了91%。效率提升,看起来是件好事。

例如搜索IT之家,跳出的 AI 概览介绍
不过,这里有几个需要留意的点。首先,Oumi的评估本身也依赖AI工具,可能存在误差。其次,谷歌对于同一个搜索查询,有时候给出的AI概览内容也不尽相同。更重要的是,数据揭示了一个值得警惕的趋势:AI生成的概览文字,与其下方引用的来源信息“对不上号”的比例,正显著上升。具体来说,这个比例已从Gemini 2时期的37%,攀升到了Gemini 3的56%。
什么叫“对不上号”呢?常见的情况有两种:要么是AI总结了一段错误的信息,但紧接着给出的链接却是正确的;要么是总结的内容大体准确,可偏偏引用了包含错误细节的网页。这就好比一位导游,指的路是对的,但介绍景点时却张冠李戴,难免让游客心里打鼓。
更有意思的是,研究人员还发现,这个AI概览功能似乎挺容易被“带节奏”。有记者做了个实验,故意发布了一篇包含虚假信息的博客文章,结果第二天,谷歌的AI概览里就引用了这篇博客的内容。这种脆弱性,无疑给虚假信息的传播开了道后门。
而普通用户在实际使用中,感受到的困惑可能更直接。比如,有位用户斯蒂芬·潘瓦西想查查摔跤手胡克·霍根(Hulk Hogan)是否去世了,AI概览明确地告诉他:“没有可信报告显示霍根已去世”。然而,就在同一搜索结果页的下方,赫然显示着一篇文章的标题,写着“霍根之死谜团加深”。一边是AI斩钉截铁的否定,一边是来源文章语焉不详的暗示,这种页面内的“自相矛盾”,着实让用户对AI生成内容的可靠性画上一个大大的问号。
对于Oumi的测试结果,谷歌发言人提出了质疑,认为他们的测试方法未能反映真实的用户搜索行为。这话当然有其道理,实验室环境与复杂多变的海量真实场景,确实存在差距。
但话说回来,无论测试方法如何,上述那些具体案例中暴露出的问题——信息与源链接脱节、内容易受污染、同一页面内信息矛盾——都是真实存在的用户体验痛点。当AI试图为我们归纳、总结、甚至直接给出答案时,其准确性与一致性的门槛,恐怕比我们想象的要高得多。每分钟近百万条潜在错误,这个数字或许只是个理论推算,但它提醒我们:在享受AI带来的便捷时,保持一份审慎和交叉验证的习惯,仍然至关重要。
售后无忧
立即购买>office旗舰店
售后无忧
立即购买>office旗舰店
售后无忧
立即购买>office旗舰店
售后无忧
立即购买>office旗舰店
正版软件
正版软件
正版软件
正版软件
正版软件
1
2
3
4
5
6
7
8
9