报告称谷歌搜索AI概览准确率约90%

　　发布于2026-04-25　阅读（0）

扫一扫，手机访问

谷歌AI概览准确率号称90%，但每小时可能产生超5700万条错误答案

这事儿挺有意思。《纽约时报》最近发布了一篇报道，里面提到谷歌那个AI概览（AI Overviews）功能的准确率，大概在90%左右。乍一听，九成准确率好像还不错？别急，咱们来算笔账。谷歌每年的搜索量超过5万亿次，如果按照这个庞大的基数来推算，哪怕只有10%的失误，也意味着每小时可能会冒出超过5700万条错误答案——相当于每分钟接近100万条。这个数字背后的潜在影响，是不是就有点惊人了？

第三方测试：准确率提升，但“图文不符”现象加剧

一家名为Oumi的AI初创公司，用SimpleQA基准对谷歌搜索做了次评估。他们分析了超过4300次搜索，结果发现，去年10月谷歌的Gemini 2模型，准确率大概是85%。到了今年2月，升级后的Gemini 3模型，把这个数字提升到了91%。效率提升，看起来是件好事。

例如搜索IT之家，跳出的 AI 概览介绍

不过，这里有几个需要留意的点。首先，Oumi的评估本身也依赖AI工具，可能存在误差。其次，谷歌对于同一个搜索查询，有时候给出的AI概览内容也不尽相同。更重要的是，数据揭示了一个值得警惕的趋势：AI生成的概览文字，与其下方引用的来源信息“对不上号”的比例，正显著上升。具体来说，这个比例已从Gemini 2时期的37%，攀升到了Gemini 3的56%。

什么叫“对不上号”呢？常见的情况有两种：要么是AI总结了一段错误的信息，但紧接着给出的链接却是正确的；要么是总结的内容大体准确，可偏偏引用了包含错误细节的网页。这就好比一位导游，指的路是对的，但介绍景点时却张冠李戴，难免让游客心里打鼓。

内容易被操纵，且存在“自打脸”矛盾

更有意思的是，研究人员还发现，这个AI概览功能似乎挺容易被“带节奏”。有记者做了个实验，故意发布了一篇包含虚假信息的博客文章，结果第二天，谷歌的AI概览里就引用了这篇博客的内容。这种脆弱性，无疑给虚假信息的传播开了道后门。

而普通用户在实际使用中，感受到的困惑可能更直接。比如，有位用户斯蒂芬·潘瓦西想查查摔跤手胡克·霍根（Hulk Hogan）是否去世了，AI概览明确地告诉他：“没有可信报告显示霍根已去世”。然而，就在同一搜索结果页的下方，赫然显示着一篇文章的标题，写着“霍根之死谜团加深”。一边是AI斩钉截铁的否定，一边是来源文章语焉不详的暗示，这种页面内的“自相矛盾”，着实让用户对AI生成内容的可靠性画上一个大大的问号。

谷歌的回应与业界的思考

对于Oumi的测试结果，谷歌发言人提出了质疑，认为他们的测试方法未能反映真实的用户搜索行为。这话当然有其道理，实验室环境与复杂多变的海量真实场景，确实存在差距。

但话说回来，无论测试方法如何，上述那些具体案例中暴露出的问题——信息与源链接脱节、内容易受污染、同一页面内信息矛盾——都是真实存在的用户体验痛点。当AI试图为我们归纳、总结、甚至直接给出答案时，其准确性与一致性的门槛，恐怕比我们想象的要高得多。每分钟近百万条潜在错误，这个数字或许只是个理论推算，但它提醒我们：在享受AI带来的便捷时，保持一份审慎和交叉验证的习惯，仍然至关重要。

本文转载于：https://www.163.com/dy/article/KQ03M23K0511B8LM.html 如有侵犯，请联系zhengruancom@outlook.com删除。
免责声明：正软商城发布此文仅为传递信息，不代表正软商城认同其观点或证实其描述。

上一篇：智谱(02513)GLM-5.1发布：逆势提价10%，开源模型超闭源，编程能力对齐Claude Opus 4.6

下一篇：REDMI Pad 2 9.7 4G版获认证全系配18W快充 4月发？

产品推荐

售后无忧
立即购买>

DAEMON Tools Lite 10【序列号终身授权 + 中文版 + Win】

￥150.00
office旗舰店
售后无忧
立即购买>

DAEMON Tools Ultra 5【序列号终身授权 + 中文版 + Win】

￥198.00
office旗舰店
售后无忧
立即购买>

DAEMON Tools Pro 8【序列号终身授权 + 中文版 + Win】

￥189.00
office旗舰店
售后无忧
立即购买>

CorelDRAW X8 简体中文【标准版 + Win】

￥1788.00
office旗舰店

正版软件

2026第一届“数元Datakernel ”数据测评体系交流研讨会成功举行

2026年2月5日，第一届“数元DataKernel”数据测评体系交流研讨会在北京成功召开中国电子技术标准化研究院副院长范科峰出席会议并致辞。来自山西、内蒙古、辽宁、上海、江苏、山东、湖北、四川等地方主管部门、数据集团，以及央国企、民企、科研机构、数据交易所等重点企业的近300名代表齐聚一堂，共同

13分钟前 0
正版软件

从“测得出”到“造得精”：昆机与海克斯康共筑中国高端制造质量底座

【科技报道记者张阳】在“十四五”收官与“十五五”开局的关键历史节点，全球产业链重构与技术竞争加剧，高质量发展成为中国制造业转型升级的核心命题。作为“工业母机”的机床行业，其发展质量直接决定国家制造业的整体竞争力。这其中，有一家企业的故事尤为值得品味。通用技术集团昆明机床股份有限公司，历经八十九

13分钟前 0
正版软件

129 → 88 元 88VIP 再降价：小米桌面移动风扇年内新低，支持 18.5 小时长续航

129 → 88 元 88VIP 再降价：小米桌面移动风扇年内新低，支持 18.5 小时长续航提起小米米家这款桌面移动风扇，很多朋友应该不陌生。它早在2022年就已发布，在小米有品平台的日常标价是129元。这个价格本身，对于一款设计、功能都到位的两用风扇来说，已经颇具竞争力。但今天要聊的，可不是

13分钟前 0
正版软件

国货当自强！张雪机车赛场扬威，徕芬家用科技重塑大众生活体验

近日，成立仅两年的张雪机车在WSBK世界超级摩托车锦标赛葡萄牙站强势夺冠，连续两回合问鼎冠军，一举打破欧美日品牌数十年垄断。从山村修车学徒到世界赛场冠军，张雪机车的“草根逆袭”刷屏全网，订单瞬间破万，成为现象级国货代表。而在消费家电领域，同样以硬核技术出圈的徕芬，也凭借高速吹风机等产品，成为年轻人

14分钟前 0
正版软件

科大讯飞学习机深度测评：三款高性价比机型，助力孩子高效学习成长

在数字化教育浪潮席卷之下，智能学习设备已成为家庭教育的热门选择。作为人工智能领域的领军企业，科大讯飞推出的系列学习机凭借技术创新与教育场景深度融合，正在重塑学生自主学习模式。本文将通过功能解析与机型对比，为家长提供选购参考。护眼这事，现在哪个家长不操心？尤其是在选学习机的时候。科大讯飞的T30 L

14分钟前 0