商城首页欢迎来到中国正版软件门户

您的位置:首页 >8G卡再战十年不是吹牛!NV重磅新技术实测 显存占用爆降85%

8G卡再战十年不是吹牛!NV重磅新技术实测 显存占用爆降85%

  发布于2026-04-24 阅读(0)

扫一扫,手机访问

随着3A大作对画面精度的要求持续升级,高精度材质纹理包的体积水涨船高。曾经的主流8GB显存显卡,如今动辄遭遇爆显存、画面卡顿、强制降画质的窘境,也被不少玩家调侃为“残废卡”。

而NVIDIA全新的RTX神经纹理压缩技术(简称NTC),或许能彻底改变这一现状。

星空

近日,Tom's Hardware对这项技术完成了多显卡、全平台的专项实测。NTC是随RTX50系列显卡一同发布的AI驱动技术,其核心在于利用显卡内置的Tensor核心(专为AI运算设计的加速单元)来处理纹理的压缩与解压。效果如何?最高可将显存需求降低超过80%,实测中甚至达到了85%的惊人降幅。更关键的是,压缩后的画面质量,竟然比游戏行业沿用多年的传统压缩方案还要好。这一结果,无疑让“8GB显卡再战十年”的期待,从一句调侃变成了切实的可能。

技术原理:跳出传统框架的AI压缩

从根子上看,NTC是一种基于机器学习的纹理压缩与解压方案,也是NVIDIA神经着色渲染新范式的核心技术之一。它最大的突破,在于跳出了传统BCn块压缩格式(游戏行业通用的标准)那套4×4像素的固定限制。在压缩阶段,NTC就将原始纹理转化成了小型神经网络的权重与潜在特征的组合。

这里必须明确一点:NTC是确定性解码技术,并非生成式AI。这意味着它不存在“AI幻觉”的风险,输出的纹理是确定且可预测的,这对于追求画面精确一致的游戏渲染至关重要。

三种运行模式:适配不同硬件与需求

为了适配从旗舰到入门的不同硬件层级,NTC在DirectX 12接口下提供了三种运行模式。另一主流接口Vulkan因功能支持问题,目前仅支持其中两种(不支持Inference on Feedback)。

第一种是加载时推理模式(Inference on Load)。 这种模式的工作流程很清晰:在游戏或地图加载阶段,全程在GPU内完成NTC纹理的解压,并同步转码为传统的BCn格式。这样一来,它的渲染性能就和原生BCn纹理完全一致,在游戏运行时没有任何额外的性能开销。它的好处显而易见——能大幅缩小游戏的磁盘占用体积,并降低PCIe总线的数据传输压力。当然,它的短板也很明确:无法降低游戏运行时的显存占用。

第二种是采样时推理模式(Inference on Sample), 这可以说是大众认知中神经纹理压缩的“完全体”,也是显存压缩能力最强的模式。它的原理很巧妙:在纹理采样时,通过一个预训练好的轻量化小型神经网络(多层感知机,MLP),实时解码出当前画面渲染所需的像素数据。正是这种“按需索取”的机制,最终实现了最高85%的显存占用降幅。

第三种是反馈时推理模式(Inference on Feedback), 此模式仅支持DirectX12接口。它借助DirectX12独有的采样器反馈功能(能够精准识别渲染当前帧到底需要哪些纹理区块),只解压那些真正需要的纹理部分。可以说,它是前两种模式的折中方案:显存降幅不如采样时推理模式那么极致,但性能开销也更低,整体表现介于两者之间。

星空

实测数据:显存暴降,画质反升

Tom's Hardware使用行业通用的Intel Sponza标准场景进行了量化测试,数据结果完全贴合官方标称。原始的无损参考材质,纹理显存占用高达6830MB。采用加载时推理模式转码为BCn格式后,显存占用降至2041MB。

而切换到采样时推理模式时,结果更为震撼:纹理显存占用仅仅为303MB。相比转码后的BCn格式,显存占用降低了85%以上;如果对比原始的无损材质,降幅更是超过了95%。

更令人惊喜的是画质。实测显示,采样时推理模式下的画面效果,比转码后的BCn纹理更接近原始参考材质,几乎做到了完美复刻。在NVIDIA官方的托斯卡纳别墅场景测试中,同等画质下,纹理显存占用可以从传统BCn格式的6.5GB,直接降至NTC格式的970MB。

性能开销:几乎可以忽略不计

测试团队覆盖了从旗舰到入门级的多款NVIDIA显卡,包括笔记本移动平台,核心测试指标是影响画面流畅度的关键——帧时间(渲染单帧所需时间,越低越流畅)。

旗舰级的RTX 5090在4K分辨率下,采用采样时推理模式并搭配主流的TAA抗锯齿,其帧时间仅比零开销的加载时推理模式增加了0.09ms。这种程度的性能损耗,在实际游戏中几乎无法被感知。

星空

星空

星空

星空

星空

星空

主流级的RTX 5070在适配的1440P分辨率下,该模式的帧时间开销在0.50-0.70ms之间。入门级的RTX 5060在1080P分辨率下,开销稳定在0.60-0.70ms。即便是笔记本上的RTX 4060移动显卡(8GB显存),在1080P下的帧时间开销也仅为0.70-0.85ms。

星空

星空

测试团队也特别指出,本次测试场景仅包含基础的前向渲染和抗锯齿流程。而实际的3A大作拥有大量不受NTC影响的渲染通道(如阴影、光照计算等),因此这项技术在实际游戏中的相对性能损耗,会比实验室的测试数据还要更低。

对于8GB显存显卡而言,只要游戏的基础帧率足够,用这点微乎其微的性能开销,去换取完全不妥协的顶级纹理画质,无疑是一笔非常划算的“交易”。

技术细节与未来展望

当然,这项技术也有明确的使用门槛。采样时推理模式必须开启随机纹理过滤(STF,用于优化纹理画质、减少瑕疵),如果关闭抗锯齿,画面会产生噪点。DLSS技术能够完全消除这类噪点,而TAA抗锯齿只能完成大部分清理工作。因此,该模式优先推荐搭配DLSS使用。

根据NTC技术开发者、NVIDIA资深工程师Alexey Panteleev的介绍,采样时推理模式更适合高性能显卡追求极致画质与显存效率,而加载时推理模式则能覆盖全平台硬件,提升加载速度和减少存储占用。游戏厂商可以按单个纹理资产来决定是否启用NTC,同时也完全可以向玩家开放模式选择,让用户根据自身的硬件配置来权衡。

值得一提的是,NTC并非NVIDIA的封闭技术。它理论上可以兼容AMD和Intel显卡的AI加速单元。行业爆料显示,索尼的下一代PS6主机也有望采用同类技术,这预示着它可能成为未来图形界的一项通用标准。

目前,尚未有游戏正式支持该技术,但全行业的布局已经落地,规模化商用近在眼前。它不仅能让手中那些“显存告急”的老显卡重获新生,体验高画质的魅力,更重要的是,它为实时图形渲染开辟了一条全新的技术路径。未来游戏的画面与资源管理,或许将由此进入一个全新的阶段。

星空

本文转载于:https://www.gamersky.com/hardware/202604/2122665.shtml 如有侵犯,请联系zhengruancom@outlook.com删除。
免责声明:正软商城发布此文仅为传递信息,不代表正软商城认同其观点或证实其描述。

热门关注