您的位置:首页 >不能只算token账
发布于2026-04-25 阅读(0)
扫一扫,手机访问
Anthropic对第三方接入工具“龙虾”的禁令一出,业界没少议论。小米大模型团队负责人罗福莉凌晨发的那篇帖子,把这事儿讨论得更透了。

她的核心观点,其实可以归结为两条主线。
第一,A社这招虽然短期内会让用户的使用成本增加,但长期看,却能给整个开发者社区注入一剂“工程纪律”的强心针。
所谓“工程纪律”,说白了就是,当模型调用成本变高,大家开发产品时自然会更精打细算,琢磨怎么优化token使用效率,从工程层面挤出更多水分。帖子里直接点了龙虾的名,批评其上下文管理做得拖沓,一个用户请求可能触发多轮工具调用,每一次都是携带冗长上下文的独立API请求,这效率可想而知。
第二,她呼吁模型厂商们,别一门心思打价格战。靠低价把用户吸引进来,回头再用缩水的模型或波动的服务来应付,最终损害的是整个行业的体验和信任。
这不由得让人联想到前阵子的观察:小米的MiMo Token Plan在同档次套餐中,定价并不算低。在《小米这次也没把价格打下来》一文中我们曾提到过这点。
罗福莉没有直接回应价格问题,但给出了另一种解读:小米的目标是“长期稳定地交付高质量的模型和服务——而不是让你冲动付款,然后弃船。”这倒是解释了为何价格未能延续大众熟悉的“性价比”叙事。话说回来,这个定价也绝非为了牟利,更多是在同行普遍亏损倾销时,选择了更贴近成本的策略。
“倾销”这个词或许有点尖锐,但如果以低于成本价售卖AI服务为标准来衡量,眼下行业内能全身而退的玩家屈指可数。有些厂商的定价确实极具侵略性,但代价可能是服务的稳定性。体验过套餐卡顿甚至间歇性失灵的用户,应该深有体会。
大模型的商业模式与传统互联网产品有本质不同。后者的边际成本可以忽略不计,用户翻倍,成本几无变化。而大模型的成本,几乎与用户规模同比例扩张。更棘手的是,作为“非标品”,厂商在后台对模型“动点手脚”,用户不易察觉,即便觉得“变笨了”也难有实据。
即便如此,必须承认,模型厂商间的价格战,目前来看仍是利大于弊,算是一种双赢。用户实实在在地用上了更便宜的服务,这是新技术得以快速普及的关键驱动力。
想想看,DeepSeek去年的模型在绝对能力上并未超越GPT或Claude,但其R1版本的意义从未被高估——它将成本降低了几十倍,这种降本对技术民主化的推动力,远胜于某个单项指标的微弱提升。
至于“亏钱卖token不可持续”的论调,对现阶段的多数二线厂商而言,可能还轮不到考虑这个问题。Anthropic模型顶尖、体验独特,哪怕时常“封号拔网线”,也挡不住用户付费的热情。根据彭博社上个月的报道,其年化收入已飙升至200亿美元,增长势头之猛,颇有挑战OpenAI王座的意味。
但二线厂商的战场截然不同。模型能力尚未拉开本质差距,排行榜上大家轮流坐庄。这时候,“性价比”就成了不得不走的路径。罗福莉对龙虾的评价很直接:它就是“vibe coding”堆出来的“屎山”。正因为是“屎山”,所以缺乏架构设计,没有工程优化,天生效率低下。
可它偏偏火起来了,让无数专业和非专业的用户愿意尝试,这本身就是一种“功德”。可以说,所有二线厂商都该感谢龙虾——很难想象,没有它作为流量放大器,这些厂商得多费劲才能证明自己的存在价值。
看看OpenRouter上的模型使用统计,就一目了然了。

在龙虾风靡之前,这个排行榜几乎被“硅谷御四家”垄断,其他厂商只能归为“Others”。如今,榜单前列已被阿里、小米、阶跃星辰等国内模型占据。

新模型发布后,先放到OpenRouter上免费试用吸引人气,几乎成了国内厂商的标准操作。这个平台俨然成了厂商们的“PR前沿阵地”。前两天阿里Qwen3.6发布,宣传登上OpenRouter榜首;小米MiMo此前也做过类似宣传。这都是免费试用带来的热度。
从这个角度看,龙虾“耗token”的特性,甚至可以被理解为一种“特色功能”。大模型研发门槛极高,但模型供给本身并不稀缺,关键在于用户用不用。龙虾把“性价比”这个杠杆,放大成了真正的竞争力。
数据不会说谎。MiniMax去年总收入7900万美元,而在龙虾爆火后的今年2月,其年度经常性收入(ARR)已超过1.5亿美元。月之暗面发布K2.5模型后,不到20天收入超过去年全年,且海外收入首次反超国内。
AI正在推动千行百业变革,但就其自身而言,独立的盈利闭环至今仍未完全跑通。OpenAI和Anthropic收入增长迅猛,但能否覆盖天价的研发与资本开支,仍是未知数。至于智谱、MiniMax、月之暗面等公司,距离形成稳健的商业模式则更为遥远。
在这种情况下,“叙事”能力就成了生存的要义。而叙事不能只靠蓝图,模型厂商的第一性原理永远是:模型得有人用。没人用,故事就讲不下去;用的人越来越多,故事才会圆满。
资本市场的反馈很直接。月之暗面去年底估值43亿美元,如今正以180亿美元寻求融资,翻了四倍多。智谱今日收盘价780港元,是其1月IPO发行价116港元的6.7倍。MiniMax的股价也从165港元的发行价,来到了950港元附近,涨幅接近6倍。
所以,账不能只算在token上。
在成本和规模的双重压力下,部分二线模型厂商已有提价动作。但这并不意味着价格战会就此熄火,竞争远未到终局。
小米的处境比较独特。它拥有完整的产品矩阵和硬件生态,MiMo的首要使命是融入并赋能这个既有生态。即便不对外售卖token,小爱同学、智能手机、小米汽车乃至庞大的IoT设备网络,都已经为MiMo提供了广阔的施展空间。
而智谱、MiniMax、月之暗面们则面临另一番景象。它们虽有C端产品,但这条赛道竞争异常惨烈。目前看来,在独立的AI应用领域,无论是通用助手还是垂直场景,字节、腾讯和阿里都具备碾压性优势,且争夺市场的意志坚决。
相较之下,通过API售卖token的生意,看上去似乎更“清爽”一些——尽管也只是相对而言。因为这更纯粹地比拼模型质量。然而,腾讯和Meta的经验表明,模型研发的成功,并非只靠资金和资源堆砌。
但必须清醒认识到,龙虾带来的“窗口期”不会无限期延续。
如果龙虾只是一阵风,热潮过后便消散,那么二线厂商自然无法再依赖这个出货渠道。
如果龙虾代表的不仅仅是一个工具的流行,而是一种C端AI产品的可行范式,那么,拥有流量、分发渠道和用户信任的科技巨头一定会出手。它们会推出自己的竞品来收割市场,并且必然会优先使用自家训练的模型,而非采购二线厂商的API。
模型与产品深度结合,已是明确的大趋势。阿里为了打通千问App与通义模型研发团队,引发了组织调整和人事震荡。姚顺雨入职腾讯后,首要任务也是推动团队整合,弥合研发与产品之间的鸿沟。
罗福莉批评龙虾浪费token时,提到了Claude Code在上下文管理上的工程优化,这恰恰是另一个产品与模型需要深度打通的典型案例。
龙虾在架构上的天然缺陷,导致每次工具调用都携带完整的长上下文发起独立请求,用户一个操作可能在后台触发十几轮API调用。这不仅烧钱,也带来延迟和不确定性。反观Claude Code,它对上下文进行精细管理,懂得何时压缩历史、何时截断,如何在保留任务状态的同时剔除冗余信息。
这背后,是Anthropic对自己模型能力边界的深刻理解。只有模型的研发者,才能将产品与模型调优成一个浑然天成的整体。
AI产品的第一代范式,是将模型作为通用API,产品只是套在外面的壳。这一范式催生了龙虾,也催生了无数套壳应用。它降低了创业门槛,但也造成了巨大的效率折损。产品不理解模型,模型不适配产品,两边都在用“蛮力”弥补彼此的信息差。
如今,第二代范式正在浮现:模型与产品从架构层面深度整合,共同设计。Claude Code提供了一个样本——模型不再是被调用的“黑箱服务”,而是产品本身不可分割的一部分。
在这一趋势下,纯粹的模型API厂商面临的挤压感会越来越强。“没有产品”可能成为它们的阿喀琉斯之踵。如果未来的核心竞争力源自模型与应用层的深度咬合,那么单纯在API层面比拼价格,无异于一场慢性消耗战。
行业里常讲“模型即产品”,用这句话来强调模型的基础性价值,当然没问题。但除非你的商业模式真的只卖API,否则,模型始终是产品的一个组成部分,而非产品的全部。两者的关系,正在从松散的“调用”走向紧密的“融合”。这才是关键所在。
售后无忧
立即购买>office旗舰店
售后无忧
立即购买>office旗舰店
售后无忧
立即购买>office旗舰店
售后无忧
立即购买>office旗舰店
正版软件
正版软件
正版软件
正版软件
正版软件
1
2
3
4
5
6
7
8
9