商城首页欢迎来到中国正版软件门户

您的位置:首页 >英伟达GTC发布Vera Rubin平台,算力与AI应用迎来新突破

英伟达GTC发布Vera Rubin平台,算力与AI应用迎来新突破

  发布于2026-04-28 阅读(0)

扫一扫,手机访问

2026 GTC大会:英伟达发布Vera Rubin平台,开启“物理AI”与效能革命

科技界再次迎来关键时刻。在2026年的GTC大会上,英伟达正式揭晓了新一代AI计算平台——Vera Rubin。这不仅仅是一次硬件迭代,更是一场面向未来的系统性布局:其整合了七款自研芯片,实现了算力的代际突破,更将AI推理成本一举压降至前代的十分之一。尤为引人注目的是,大会首次明确提出了“物理AI”的概念,旨在为智能体的跨越式发展注入全新动能。

七芯协同:算力、成本与效率的全面飞跃

Vera Rubin平台的核心奥秘,在于其独创的七芯协同架构。该架构囊括了Vera CPU、Rubin GPU等七款专用芯片,通过深度的协同设计,彻底消除了传统系统中的通信瓶颈。其中,作为主角的Rubin GPU采用了前沿的3nm制程工艺,在NVFP4精度下的算力高达50 PFLOPS——这一数字,相较于上一代的Blackwell架构,足足提升了5倍。

这带来的效果是立竿见影的:模型训练速度提升3.5倍,而单位Token的生成成本则惊人地降低了90%。这意味着什么?意味着那些曾因算力成本和速度限制而徘徊在实验室的大规模AI模型,如今有了规模化落地的坚实基座。成本的断崖式下降,无疑是AI应用爆发的关键催化剂。

存储、推理与“物理AI”的落地蓝图

仅有强大的计算芯片还不够,存储与推理环节同样是瓶颈所在。为此,英伟达推出了全新的BlueField-4 STX机架,并搭配了专用的DOCA Memos框架。这套组合拳能够极其高效地处理海量的KV缓存数据,在显著降低功耗的同时,将推理吞吐量提升了5倍。

与此同时,平台还纳入了Groq 3 LPX推理加速机架,其内部集成了256个LPU处理器。当它与Vera Rubin平台深度融合后,每兆瓦电力所能驱动的推理吞吐量,最高可提升35倍。能效比的革命性进步,直接关系到数据中心运营的可行性与经济性。

当然,软硬件协同的“魔法”不止于此。平台采用的GPU与LPU解耦推理技术,已经能够实现万亿参数模型的毫秒级响应。而更富远见的举措,是推出Space-1太空数据中心模块,并结合自动驾驶模型的演进,全力推动“物理AI”从概念走向现实。据悉,梅赛德斯-奔驰的CLA车型将率先进行整合路测,这或许就是智能体与现实世界深度交互的一个起点。

宏伟目标与不可忽视的挑战

会上,黄仁勋宣布了英伟达在2027年的AI算力营收目标:1万亿美元。这并非空谈,微软、AWS等顶级云服务商已成为平台的首批采购方,预示着生态的快速铺开。可以预见,全球市场,包括中国市场在内,都将迎来一轮AI基础设施与应用的建设高峰。

平台的绿色基因也值得一提:其采用100%液冷设计,将PUE(电能使用效率)控制在1.1以下的优异水平。同时,Rubin GPU搭载了288GB的HBM4显存,并通过开源生态的持续扩张,降低开发者的入门门槛。

然而,通往未来的道路绝非坦途。有几个关键挑战必须正视:台积电3nm工艺的良率爬坡、HBM4存储器的供应紧张问题,以及日益白热化的市场竞争环境。这些因素,都将直接影响到Vera Rubin平台能否顺利实现大规模量产,并持续保持领先优势。

(文中图片来源于网络)

本文转载于:https://article.pchome.net/content-2194073.html 如有侵犯,请联系zhengruancom@outlook.com删除。
免责声明:正软商城发布此文仅为传递信息,不代表正软商城认同其观点或证实其描述。

热门关注