您的位置:首页 >存储涨价之后,如何让AI走向数据?丨ToB产业观察
发布于2026-05-06 阅读(0)
扫一扫,手机访问

先看一组震撼的数据:国家数据局显示,从2024年到2026年,中国日均Token调用量从1000亿飙升至140万亿(截至2026年3月)。两年增长超过千倍,这背后传递的信号再清晰不过——AI已彻底告别实验室的模型训练阶段,正全面涌入生产和生活的每一个角落。
这场浪潮冲击之下,一个根本性的角色转换正在发生。过去,存储设备的使命是“数据保存”,像个忠实的仓库管理员;如今,它的职责被刷新为“数据赋能”。换句话说,它不再是被动承载数据的“容器”,而是必须主动参与数据处理、支撑AI高效运转的“核心枢纽”。
对于存储行业而言,这个拐点带来的绝非温和的增量增长,而是一场彻头彻尾的全面重构。而重构的核心逻辑,也发生了根本逆转:不再是让数据走向AI,而是要让AI走向数据。
“原来的企业存储核心是做数据保护,现在AI存储的第一目标变成了效率提升——核心就一句话,如何充分满足GPU对数据的饥渴需求,别让它空转。”浪潮信息存储产品部副总经理郭海峰的这句话,精准概括了存储使命的根本性变化。
这远不止是产品定位的调整,而是整个技术架构的“基因重组”。传统企业级存储是典型的“通算架构”,以CPU为核心。数据需要经过CPU的路径解析,从内核态复制转发,才能抵达GPU进行计算。这套流程服务关系型数据库和传统应用游刃有余,但面对智算时代动辄百卡、千卡的GPU集群时,效率瓶颈就暴露无遗:一旦存储拖了后腿,价格昂贵的GPU就只能空转等待。
数据最能说明问题的严重性。IBM大中华区存储事业部总经理吴磊指出,如今GPU部署规模庞大,投资动辄以亿甚至十亿计,“1%的闲置就意味着上亿元的浪费”。这与郭海峰的观点不谋而合:存储和网络在智算系统中成本占比或许只有5%-10%,但如果它们导致GPU空转,这区区百分之几的成本,就足以毁掉其余90%以上的投资回报。
为了满足企业对算力利用率的极致追求,存储的“基因重组”势在必行。目前,从软件和硬件两个层面切入,都能有效优化整体架构。浪潮信息和IBM恰好是这两个方向的典型代表。
浪潮信息在其新发布的A9000系列产品中,采用了“全链路免锁零拷贝的用户态AI原生并行架构”。简单来说,就是把数据传输路径从传统的内核态切换到了用户态协议栈,实现了端到端的免拷贝。这一改动效果显著,将延迟从毫秒级降至微秒级,单节点带宽更是达到了160GB/s,远超行业主流的60-80GB/s水平。
软件架构变革的背后,其实暗藏一条更深层的技术主线:KV Cache。在AI推理场景中,为了加速响应、避免重复计算,系统需要将键值对缓存保留在高速存储中。但随着模型上下文窗口的急剧扩大,KV Cache的规模早已超出了GPU显存和本地DRAM的承载极限。郭海峰详细解释了其中的技术逻辑:通过PD分离(Prefill与Decode分离),并利用GlobalCast技术和“双路径”设计,可以整合利用空闲带宽,显著缩短首Token的产生时间。根据浪潮信息公布的数据,通过其Agent Memory外置存储架构,A9000能将首Token延迟降低97%,Token吞吐量提升超过20倍。
另一边,IBM则从另一个维度切入。其推出的Storage Scale并行文件系统,能够在万卡集群中支撑高频的checkpoint数据落盘,确保数据在极短时间内写入存储,从而充分释放GPU的计算效率。
除了软件优化,硬件层面的革新同样关键。IBM在其自研的第五代闪存核心模块(FlashCore Module 5)的每块NVMe闪盘上,都嵌入了一颗专用芯片和高性能处理器,实现了硬件级的压缩、去重和加密。吴磊透露,这一设计能将压缩比做到1:5,而且由于压缩在盘上完成,完全不会对存储控制器的性能造成负担。
种种技术演进都指向同一个结论:AI时代的存储,正从一个被动的数据容器,进化成具备感知和计算能力的主动节点。
当存储节点进化为承载KV Cache、主动参与计算卸载的智能枢纽,市场对高带宽、低延迟存储介质的依赖便呈指数级攀升。这种由架构变革催生的庞大需求缺口,直接在上游供应链引发了产量倾斜与价格博弈。
多方数据显示,2026年第一季度,DRAM内存合约价涨幅达90%-95%,NAND Flash闪存合约价涨幅达55%-60%。这轮涨价潮的直接推手就是AI——大模型训练和推理需求井喷,导致原厂将大量产能从消费级转向利润更高的企业级AI产品。TrendForce预测,2026年第二季度NAND闪存合约价将继续大幅跳升70%至75%。
然而,在吴磊和郭海峰看来,存储涨价只是一时的市场现象,真正值得长期关注的,是如何通过技术手段优化整体效率。郭海峰提到一个案例:有企业将存储迁移到高带宽方案后,GPU利用率提升了15%——“用不到整个项目10%的钱采购存储,就把卡的利用率提升了15%”。吴磊则算了一笔更直观的账:通过FCM模块的1:5压缩技术,用户在涨价后开启压缩功能,实际可用容量的单位成本甚至比涨价前还要低。
但成本优化远不止于压缩比。存储行业正在经历的,是对“数据应该放在哪里”这一根本问题的重新思考。传统企业级存储中,“热、温、冷”数据分层管理已是成熟理念,但AI时代的分层逻辑远比过去复杂得多。
于是,五层存储体系应运而生,这可以说是AI给存储行业带来的最直观的结构性变化。按照业界通行的分类:第一层是HBM(高带宽内存),第二层是本地DRAM,第三层是本地SSD,第四层是传统企业级外置存储。而在第三层和第四层之间,现在出现了一个关键的“3.5层”——这是一个专门服务于AI推理场景的外置缓存层。
为什么需要这个3.5层?郭海峰的解释很直接:“3.5层是为了效率,可以放弃一定的可靠性。数据比是1:1,大不了数据丢了重新算,但不能牺牲效率。”这与第四层传统存储“数据保护优先”的理念形成了鲜明对比。吴磊也从经济学角度给出了类似判断:“全用HBM当然最好,但HBM太贵了。”在成本约束下,分层存储是必然选择。
在五层存储体系的影响下,“磁带存储”这个看似古老的技术,又一次凭借其极高的性价比成为企业的重要选项。据吴磊介绍,过去几年,多家大厂已部署了EB级甚至10EB级的磁带库,包括百度智能云也将其用于底层的冷数据存储。由IBM、HPE和Quantum联合推动的LTO联盟,其LTO-10已实现40TB原始容量,在2.5:1压缩比下可达100TB,未来的LTO-11、LTO-12容量还将更大。吴磊提供了一个实用视角:磁带机械臂从最远端抓取数据大约需要一分五十多秒,但如果一个数据三个月甚至六个月才访问一次,这两分钟的等待时间完全在可接受范围内。
这一轮存储行业的变革,其深刻程度远非五层存储体系所能完全体现。它映射出了一个更为底层的变化:传统的“让数据走向AI”模式已难以为继,“让AI走向数据”正在成为新的主流。
在传统数据使用模式中,AI应用是纯粹的“索取方”:应用发起请求,存储被动响应。这种模式在小规模、低频次场景下尚可运行,但面对EB级数据、百万级并发请求时,就完全不可持续了。更致命的问题在于数据一致性的崩塌。吴磊用了一个生动的比喻来描述这一困境:“我们每个人可能有好几个TB的照片、视频,企业则是几百个TB、几百个PB,甚至EB级。当数据有多个副本时,哪一个副本说的是真话,哪一个说的又是假话?”
面对这一挑战,IBM给出的解决方案是内容感知存储(Content-Aware Storage, CAS),其核心理念是结合单一数据副本和即时感知数据变化的机制。也就是说,数据一旦发生变化,模型能够即时感知,而无需通过繁琐的副本生产和传输来同步。吴磊强调:“过去部分厂商出于销售目的,可能会建议客户不断扩容升级。存储管理员则疲于应对各种报告和数据迁移。现在有了AI智能体,它可以分析完所有数据后,一次性做出最优决策,甚至能完成跨洲的数据迁移。”
这意味着,存储的角色正从被动的数据仓库,转变为主动的数据编排平台。而这个解题思路,似乎正在成为行业共识。IBM提出的内容感知存储,与浪潮信息倡导的“AI Data Platform”概念有许多相通之处。郭海峰这样阐述“AI Data Platform”:数据不应是静态的“湖”,而应是“一条不断流淌的河流,不断有数据进来,不断去处理、清洗、打标和再优化,重新训练模型”。这种动态的数据管理逻辑,与传统的“先存下来以后再说”的思路有着本质区别。
从产业视角看,“让AI走向数据”正在催生新的协同模式。浪潮信息利用其全栈能力(从底层算力到上层平台)为合作伙伴提供基础设施,郭海峰将其形容为“搭台唱戏”——浪潮信息搭台,伙伴们来唱AI这场戏。IBM则宣布与英伟达进一步扩大合作,在GTC 2026上展示了深度集成方案:Storage Scale System 6000可提供10PB高性能存储,用于支撑GPU原生分析引擎,IBM同时计划于2026年第二季度初在IBM Cloud上提供英伟达Blackwell Ultra GPU。
但所有这些技术与合作的最终落点,仍然是人。吴磊在沟通中反复强调一个观点:“AI是一个工具,不能代替人,它没有情感,也无法做决定,最终做决定的仍是人类。”无论是浪潮信息致力于让GPU“不空转”,还是IBM用AI智能体帮助存储管理员轻松管理数十个同构或异构节点,其终极目标都是一致的:将人从繁琐、重复的运维工作中解放出来,让他们能将更多的注意力和创造力投向真正的业务创新。
IBM商业价值研究院的调研揭示了一个有趣的现象:76%的CEO对自己企业的IT架构“非常自信”,但43%的CIO却感到焦虑。这种认知落差恰恰说明,AI时代的数据基础设施挑战,远比表面看到的更为复杂。“让存储融入平时的业务中,而不是让业务等存储”——这句总结,或许正是这个时代对存储行业最朴素也最关键的要求。
回望过去两年,存储行业经历了从波澜不惊到惊涛骇浪的转变。当全球AI总支出逼近万亿美元量级,当Token成本的每一次下降都直接影响着大模型的经济可行性,存储不再只是技术链条的终点,它正在成为AI价值创造中不可或缺、且日益主动的一环。
(文|Leo张ToB杂谈,作者|张申宇,编辑丨杨林)
售后无忧
立即购买>office旗舰店
售后无忧
立即购买>office旗舰店
售后无忧
立即购买>office旗舰店
售后无忧
立即购买>office旗舰店
正版软件
正版软件
正版软件
正版软件
正版软件
1
2
3
4
5
6
7
8
9