商城首页欢迎来到中国正版软件门户

您的位置:首页 >NVIDIA DGX Spark 为桌面端最新开源与前沿AI模型提供强大算力支持

NVIDIA DGX Spark 为桌面端最新开源与前沿AI模型提供强大算力支持

  发布于2026-04-27 阅读(0)

扫一扫,手机访问

开源 AI 正在加速各行各业的创新,NVIDIA DGX Spark 将帮助开发者将创新转化为影响力。

星空

就在今年CES展会上,NVIDIA上演了一出好戏。他们向世界展示了DGX Spark——这台桌面级的AI超级计算机,是如何让开发者把数据中心级别的算力,真正“搬”到自己办公桌上的。这意味着,最新的开源模型和前沿AI技术,不再遥不可及,而是触手可及。一个更具体的突破是,现在你甚至可以在DGX Spark上,流畅运行参数高达1000亿的庞大模型。

这台设备的底气,源于其内置的NVIDIA Grace Blackwell架构。它配备了大容量统一内存,并拥有PF级别的AI性能。这种设计非常巧妙:开发者可以在本地完成核心的开发与测试工作,一旦需要更大规模的运算,又能轻松无缝地扩展到云端。这相当于为AI研发打通了“最后一公里”。

在开源 AI 模型上的性能提升

开源AI模型的迭代速度越来越快,但过去,许多经过高度优化的模型往往只能在庞大的数据中心里运行。现在情况不同了。持续的模型优化工作,加上与开源社区的深度合作,使得这些“重量级选手”也能在DGX Spark这样的桌面端获得显著的加速。

开箱即用是它的另一大优势。DGX Spark预先配置好了完整的NVIDIA AI软件栈和CUDA-X库。对于开发者、研究人员和数据科学家来说,这相当于拿到了一套已经调校至最佳状态的工具,可以立刻投入到AI模型的构建、微调和运行中,省去了大量繁琐的环境配置时间。

可以说,DGX Spark为所有开发者提供了一个在桌面端驾驭最新AI模型的坚实底座。它原生支持在桌面上直接运行最新的框架和开源模型,例如前不久刚刚发布的NVIDIA Nemotron 3模型系列。

性能跃升的背后,是硬件架构的革新。为DGX Spark提供核心算力的Blackwell架构,引入了一项名为NVFP4的新数据格式。这项技术的关键在于,它能在几乎不损失模型精度的前提下,将AI模型压缩高达70%,同时带来显著的性能提升。这直接解决了大模型对显存的苛刻需求。

扩展 AI 与创意工作流

DGX Spark的定位非常清晰:它旨在支持从原型设计、微调、推理到数据科学的完整AI开发生命周期。无论是医疗、机器人、零售,还是内容创作,它都能满足不同行业对AI应用的特定需求。

对内容创作者而言,这意味着生产力的解放。最新的扩散模型和视频生成模型,比如阿里巴巴的Qwen-Image,现在已支持NVFP4格式,从而降低显存占用、加速生成过程。CES现场的演示很直观:将高负载的视频生成任务从创作者的笔记本电脑卸载到DGX Spark后,相比顶配的M4 Max MacBook Pro,实现了高达8倍的加速。更重要的是,创作者本地的系统资源被彻底释放,确保创意流程不会因电脑卡顿而中断。

在游戏MOD领域,开源的RTX Remix平台正在为3D艺术家和MOD制作者赋能。借助DGX Spark的生成式AI能力,创作效率大大提升。现场演示了一个MOD团队的工作流:他们将所有资产创建的重头工作都转移到DGX Spark上进行,这样一来,团队成员的个人电脑就能专注于无间断的MOD开发,并能实时在游戏中预览修改效果。

AI编码助手也在重塑开发者的工作方式。CES上展示了一款在DGX Spark上运行、由NVIDIA Nsight驱动的本地CUDA编码助手。它的好处是双重的:开发者既能享受到AI辅助编程带来的高效企业级开发体验,又能将源代码安全地保存在本地环境中,满足数据安全和合规的需求。

行业领导者验证本地 AI 转型的趋势

随着市场对安全、高性能边缘AI的需求日益增长,DGX Spark在整个行业中获得越来越多的关注和实际采用,已然成为一种趋势。

软件巨头、开源社区的先驱以及全球工作站合作伙伴,正在纷纷引入DGX Spark。他们的目标很明确:在不依赖复杂集中式基础设施的情况下,实现本地的AI推理、智能体工作流以及检索增强生成(RAG)应用。

来自各方的反馈都指向同一点:DGX Spark正在帮助团队实现更快的迭代周期,提供更强的数据和知识产权控制力,并在桌面端开启了全新的、交互性更强的AI体验。

CES上还有一个生动的范例:NVIDIA展示了如何利用DGX Spark的强劲算力,驱动Hugging Face的Reachy Mini机器人,将虚拟的AI智能体带入现实世界。

对此,Hugging Face产品副总裁Jeff Boudier评价道:“开放模型让开发者能够按自己的意愿构建AI,而DGX Spark将这种能力带到了桌面上。当它与Reachy Mini结合时,本地的AI智能体就拥有了实体和声音。它们能看见你、聆听你,并用富有表现力的动作回应你——这让强大的AI变成了真正可互动的伙伴。”

目前,Hugging Face和NVIDIA已经联合发布了如何使用DGX Spark和Reachy Mini构建交互式AI智能体的详细指南。

IBM数据与AI平台战略副总裁Ed Anuff也表示:“DGX Spark将前沿的AI推理能力带到了边缘侧。借助运行在Spark上的OpenRAG,用户可以获得一个完整、自包含的一体化RAG堆栈,覆盖从数据抽取、嵌入、检索到推理的全流程。”

JetBrains首席执行官Kirill Skrygan则从企业角度给出了看法:“对于那些需要完全掌控安全性、治理和知识产权的组织来说,NVIDIA DGX Spark带来了PF级别的AI性能。无论客户偏好云端、本地还是混合部署,JetBrains AI都能在他们选择的环境中提供支持。”

展会上,一款名为TRINITY的、面向城市出行的智能自平衡三轮单座车吸引了众多目光。它的“大脑”正是DGX Spark,用于对开源、实时的视觉语言模型工作负载进行AI推理。

音乐人兼企业家will.i.am对此感慨:“TRINITY代表了微出行的未来——人类、交通工具与AI智能体无缝协作。以NVIDIA DGX Spark作为其AI大脑,TRINITY提供了具备对话能力和目标跟踪的工作流,正在改变人们在智慧城市中与出行工具的交互方式。这简直是一个装在轮子上的‘大脑’,是从智能体理念出发进行设计的典范。”

加速 AI 开发者采用

为了帮助开发者快速启动真实的AI项目,NVIDIA提供了丰富的DGX Spark实践指南(playbooks)。在本次CES上,这一资源库得到了显著扩充,新增了6个全新指南,并对4个现有指南进行了重大更新。新内容覆盖了诸多热点领域,包括最新的NVIDIA Nemotron 3 Nano模型、机器人训练、视觉语言模型、使用双DGX Spark系统进行模型微调,以及基因组学和金融分析等。

在软件生态支持方面,NVIDIA AI Enterprise软件套件现已面向来自制造合作伙伴的DGX Spark和GB10系统开放。该套件包含了AI应用开发和模型部署所需的各类库、框架和微服务,以及用于GPU优化的算子与驱动,旨在实现快速、可靠的AI工程化与部署。相关许可证预计将于1月底正式推出。

购买途径

目前,DGX Spark以及合作伙伴的GB10系统,已通过宏碁、华硕、戴尔、技嘉、惠普、联想、微星、新华三、超聚变、紫光晓通、丽台科技、英迈、神州数码等众多渠道开放购买。有关DGX Spark的更多技术细节,可以参考NVIDIA发布的官方技术博客。软件产品的具体信息,请查阅相关声明。

关于NVIDIA
NVIDIA(纳斯达克股票代码:NVDA)是全球加速计算领域的领导者。

本文转载于:https://www.gamersky.com/hardware/202603/2115226.shtml 如有侵犯,请联系zhengruancom@outlook.com删除。
免责声明:正软商城发布此文仅为传递信息,不代表正软商城认同其观点或证实其描述。

热门关注