您的位置:首页 >史上最强 AI 基建方案:英伟达发布 Vera Rubin 平台,单 Token 成本降至 1/10
发布于2026-04-30 阅读(0)
扫一扫,手机访问
美国加州圣何塞传来重磅消息——在今日开幕的2026年GTC大会上,英伟达正式推出以天文学家命名的Vera Rubin AI平台,标志着智能体AI发展进入全新阶段。
英伟达创始人黄仁勋在主题演讲中强调,这绝非普通迭代,而是一次代际飞跃。Vera Rubin的发布,意味着英伟达启动了史上最大规模的基础设施建设,其覆盖范围从大规模预训练一直延伸到实时智能体推理,完整贯穿AI全生命周期。

新一代NVL72机架展现了令人瞩目的技术突破。通过NVLink 6技术,这套系统将72块Rubin GPU与36块Vera CPU紧密连接,构建起前所未有的算力集群。

与上一代Blackwell平台相比,新系统的效率提升堪称惊人。在训练混合专家大模型时,仅需四分之一数量的GPU即可完成任务。更关键的是,每瓦推理吞吐量提升了整整10倍,直接将单Token成本压缩到原来的十分之一。
专为验证AI模型结果设计的Vera CPU机架同样不容小觑。这套系统集成了256块液冷CPU,运行效率达到传统CPU的两倍,速度提升50%,为AI模型的可靠性验证提供了强力保障。

面对智能体系统对低延迟和长上下文的严苛要求,英伟达拿出了Groq 3 LPX推理加速机架。该系统配备256个LPU处理器,与Vera Rubin平台结合后,每兆瓦推理吞吐量最高可提升35倍,彻底解决了智能体推理的瓶颈问题。


数据存储方面,全新的BlueField-4 STX机架构建了真正意义上的AI原生存储基础架构。借助创新的DOCA Memos框架,该系统能够高效处理大型语言模型生成的海量键值缓存数据,在显著降低能耗的同时,将推理吞吐量提升最高5倍,从而实现更快速的AI多轮交互。

随着这一系列重磅发布的落地,英伟达在GTC 2026大会上再次证明了其在AI基础设施领域的领先地位。从算力到存储,从训练到推理,Vera Rubin平台的全栈解决方案,无疑将为下一代AI应用奠定坚实基础。
英伟达 GTC 2026 大会专题
售后无忧
立即购买>office旗舰店
售后无忧
立即购买>office旗舰店
售后无忧
立即购买>office旗舰店
售后无忧
立即购买>office旗舰店
正版软件
正版软件
正版软件
正版软件
正版软件
1
2
3
4
5
6
7
8
9