商城首页欢迎来到中国正版软件门户

您的位置:首页 >小米罗福莉LLM 公司应谨慎定价避免价格战引发恶性循环

小米罗福莉LLM 公司应谨慎定价避免价格战引发恶性循环

  发布于2026-04-25 阅读(0)

扫一扫,手机访问

小米集团 MiMo 负责人谈AI行业Token价格战:效率才是未来关键

就在昨天,小米集团MiMo负责人罗福莉在X平台发表了一篇长文,直指当下AI行业愈演愈烈的“Token(词元)价格战”,其中的分析与判断,颇有些拨云见日的意味。

▲ 图源:罗福莉本人社媒账号

罗福莉的思考,主要由Anthropic几天前切断Claude第三方工具订阅通道一事触发。无独有偶,MiMo也在近期推出了自家的Token Plan,这让她对行业现状有了更深的感触。她的核心观点可以归结为以下几方面:

1. 漂亮的订阅设计,难掩巨大的成本鸿沟

首先得承认,Claude Code的订阅机制在计算资源分配上确实设计精妙。但其商业可行性却要打一个大大的问号——它很可能并不赚钱,甚至处于亏损状态,除非其API利润率能高出十倍乃至二十倍。

问题出在哪里?关键在于第三方框架的接入方式。以OpenClaw为例,仔细剖析其上下文管理机制,你会发现效率着实堪忧。一次用户请求,常常会触发多轮价值不高的工具调用,而每一轮都是独立的API请求,并且都携带着超长上下文(动辄超过10万tokens)。

即便存在缓存命中的情况,这种粗放的调用方式依然造成了巨大的资源浪费。更极端的是,它还会抬高其他请求的缓存未命中率。结果就是,每个用户实际触发的API调用次数,轻松就能达到Claude Code原生框架的数倍之多。折算成API成本,很可能高达订阅价格的几十倍。这已非简单的“差距”,而是一道“巨大的成本鸿沟”。

2. 断供“便车”,倒逼工程自律

当然,Anthropic此举并非彻底封杀。OpenClaw、OpenCode等第三方框架仍然可以通过API调用Claude,只是不能再“搭便车”使用用户的订阅额度了。

短期阵痛在所难免。这些智能体的用户会直接感受到成本压力,使用费用上涨几十倍可能都是家常便饭。但话说回来,这种压力未必全是坏事。它恰恰会倒逼这些第三方框架去优化其上下文管理逻辑,努力提升提示词缓存的命中率,从根本上减少Token的浪费。

这种痛苦,最终将转化为工程实践上的“自律”。

3. 警惕价格战陷阱:低效的消耗是恶性循环

基于上述观察,一个务实的建议浮出水面:各大LLM公司,在没想清楚如何设计一个不亏钱的编程订阅方案之前,最好不要盲目卷入价格战。

把Token价格压得很低,同时完全开放第三方框架接入——这看起来是对用户极致友好,实则恰恰落入了Anthropic刚刚挣脱的陷阱。更深层的问题在于,如果用户的注意力被大量消耗在低效的Agent框架上,那么当他们面对不稳定且缓慢的推理服务时,就只能在降级版的“成本节省型”大模型里打转,任务依然无法完成。

这对于用户体验和长期留存来说,无疑是一个可怕的恶性循环。

4. MiMo的选择:稳定品质优于冲动消费

那么,MiMo自家的Token Plan计划秉持何种逻辑?它支持第三方工具,按Token实际使用量计费,这与Claude新推出的额外使用套餐在思路上不谋而合。目标很明确:旨在长期、稳定地提供高品质服务,而不是鼓励用户冲动消费后迅速“弃坑”。

从宏观视角看,全球计算资源的增长步伐,已经开始跟不上Agent应用激发的Token需求暴涨。真正的出路何在?答案不是无休止地提供更廉价的Token,而在于让“更高效的Agent框架”与“更强大且更高效的模型”协同演进,形成合力。

回过头看,Anthropic这次的举措,无论其初衷如何,客观上都在推动开源与闭源生态朝着更健康的方向发展。这或许,正是行业成熟过程中必须经历的一课。

归根结底,Agent时代的赢家,不属于那些只会消耗最多算力的人,而属于最懂得如何高效利用每一份算力的人

本文转载于:https://www.itren.com/digital/172933.html 如有侵犯,请联系zhengruancom@outlook.com删除。
免责声明:正软商城发布此文仅为传递信息,不代表正软商城认同其观点或证实其描述。

热门关注