商城首页欢迎来到中国正版软件门户

您的位置:首页 >史上最强 AI 基建方案:英伟达发布 Vera Rubin 平台,单 Token 成本降至 1/10

史上最强 AI 基建方案:英伟达发布 Vera Rubin 平台,单 Token 成本降至 1/10

  发布于2026-04-30 阅读(0)

扫一扫,手机访问

史上最强 AI 基建方案:英伟达发布 Vera Rubin 平台,单 Token 成本降至 1/10

美国加州圣何塞传来重磅消息——在今日开幕的2026年GTC大会上,英伟达正式推出以天文学家命名的Vera Rubin AI平台,标志着智能体AI发展进入全新阶段。

英伟达创始人黄仁勋在主题演讲中强调,这绝非普通迭代,而是一次代际飞跃。Vera Rubin的发布,意味着英伟达启动了史上最大规模的基础设施建设,其覆盖范围从大规模预训练一直延伸到实时智能体推理,完整贯穿AI全生命周期。

史上最强 AI 基建方案:英伟达发布 Vera Rubin 平台,单 Token 成本降至 1/10

核心算力突破:NVL72机架实现效率跃升

新一代NVL72机架展现了令人瞩目的技术突破。通过NVLink 6技术,这套系统将72块Rubin GPU与36块Vera CPU紧密连接,构建起前所未有的算力集群。

史上最强 AI 基建方案:英伟达发布 Vera Rubin 平台,单 Token 成本降至 1/10

与上一代Blackwell平台相比,新系统的效率提升堪称惊人。在训练混合专家大模型时,仅需四分之一数量的GPU即可完成任务。更关键的是,每瓦推理吞吐量提升了整整10倍,直接将单Token成本压缩到原来的十分之一。

专用CPU架构:Vera CPU机架专攻AI验证

专为验证AI模型结果设计的Vera CPU机架同样不容小觑。这套系统集成了256块液冷CPU,运行效率达到传统CPU的两倍,速度提升50%,为AI模型的可靠性验证提供了强力保障。

史上最强 AI 基建方案:英伟达发布 Vera Rubin 平台,单 Token 成本降至 1/10

推理加速方案:应对智能体特殊需求

面对智能体系统对低延迟和长上下文的严苛要求,英伟达拿出了Groq 3 LPX推理加速机架。该系统配备256个LPU处理器,与Vera Rubin平台结合后,每兆瓦推理吞吐量最高可提升35倍,彻底解决了智能体推理的瓶颈问题。

史上最强 AI 基建方案:英伟达发布 Vera Rubin 平台,单 Token 成本降至 1/10

史上最强 AI 基建方案:英伟达发布 Vera Rubin 平台,单 Token 成本降至 1/10

存储架构革新:BlueField-4 STX构建AI原生存储

数据存储方面,全新的BlueField-4 STX机架构建了真正意义上的AI原生存储基础架构。借助创新的DOCA Memos框架,该系统能够高效处理大型语言模型生成的海量键值缓存数据,在显著降低能耗的同时,将推理吞吐量提升最高5倍,从而实现更快速的AI多轮交互。

史上最强 AI 基建方案:英伟达发布 Vera Rubin 平台,单 Token 成本降至 1/10

随着这一系列重磅发布的落地,英伟达在GTC 2026大会上再次证明了其在AI基础设施领域的领先地位。从算力到存储,从训练到推理,Vera Rubin平台的全栈解决方案,无疑将为下一代AI应用奠定坚实基础。

英伟达 GTC 2026 大会专题

本文转载于:https://www.ithome.com/0/929/683.htm 如有侵犯,请联系zhengruancom@outlook.com删除。
免责声明:正软商城发布此文仅为传递信息,不代表正软商城认同其观点或证实其描述。

热门关注