不能只算token账

　　发布于2026-04-25　阅读（0）

扫一扫，手机访问

01

Anthropic对第三方接入工具“龙虾”的禁令一出，业界没少议论。小米大模型团队负责人罗福莉凌晨发的那篇帖子，把这事儿讨论得更透了。

她的核心观点，其实可以归结为两条主线。

第一，A社这招虽然短期内会让用户的使用成本增加，但长期看，却能给整个开发者社区注入一剂“工程纪律”的强心针。

所谓“工程纪律”，说白了就是，当模型调用成本变高，大家开发产品时自然会更精打细算，琢磨怎么优化token使用效率，从工程层面挤出更多水分。帖子里直接点了龙虾的名，批评其上下文管理做得拖沓，一个用户请求可能触发多轮工具调用，每一次都是携带冗长上下文的独立API请求，这效率可想而知。

第二，她呼吁模型厂商们，别一门心思打价格战。靠低价把用户吸引进来，回头再用缩水的模型或波动的服务来应付，最终损害的是整个行业的体验和信任。

这不由得让人联想到前阵子的观察：小米的MiMo Token Plan在同档次套餐中，定价并不算低。在《小米这次也没把价格打下来》一文中我们曾提到过这点。

罗福莉没有直接回应价格问题，但给出了另一种解读：小米的目标是“长期稳定地交付高质量的模型和服务——而不是让你冲动付款，然后弃船。”这倒是解释了为何价格未能延续大众熟悉的“性价比”叙事。话说回来，这个定价也绝非为了牟利，更多是在同行普遍亏损倾销时，选择了更贴近成本的策略。

“倾销”这个词或许有点尖锐，但如果以低于成本价售卖AI服务为标准来衡量，眼下行业内能全身而退的玩家屈指可数。有些厂商的定价确实极具侵略性，但代价可能是服务的稳定性。体验过套餐卡顿甚至间歇性失灵的用户，应该深有体会。

大模型的商业模式与传统互联网产品有本质不同。后者的边际成本可以忽略不计，用户翻倍，成本几无变化。而大模型的成本，几乎与用户规模同比例扩张。更棘手的是，作为“非标品”，厂商在后台对模型“动点手脚”，用户不易察觉，即便觉得“变笨了”也难有实据。

即便如此，必须承认，模型厂商间的价格战，目前来看仍是利大于弊，算是一种双赢。用户实实在在地用上了更便宜的服务，这是新技术得以快速普及的关键驱动力。

想想看，DeepSeek去年的模型在绝对能力上并未超越GPT或Claude，但其R1版本的意义从未被高估——它将成本降低了几十倍，这种降本对技术民主化的推动力，远胜于某个单项指标的微弱提升。

至于“亏钱卖token不可持续”的论调，对现阶段的多数二线厂商而言，可能还轮不到考虑这个问题。Anthropic模型顶尖、体验独特，哪怕时常“封号拔网线”，也挡不住用户付费的热情。根据彭博社上个月的报道，其年化收入已飙升至200亿美元，增长势头之猛，颇有挑战OpenAI王座的意味。

但二线厂商的战场截然不同。模型能力尚未拉开本质差距，排行榜上大家轮流坐庄。这时候，“性价比”就成了不得不走的路径。罗福莉对龙虾的评价很直接：它就是“vibe coding”堆出来的“屎山”。正因为是“屎山”，所以缺乏架构设计，没有工程优化，天生效率低下。

可它偏偏火起来了，让无数专业和非专业的用户愿意尝试，这本身就是一种“功德”。可以说，所有二线厂商都该感谢龙虾——很难想象，没有它作为流量放大器，这些厂商得多费劲才能证明自己的存在价值。

看看OpenRouter上的模型使用统计，就一目了然了。

在龙虾风靡之前，这个排行榜几乎被“硅谷御四家”垄断，其他厂商只能归为“Others”。如今，榜单前列已被阿里、小米、阶跃星辰等国内模型占据。

新模型发布后，先放到OpenRouter上免费试用吸引人气，几乎成了国内厂商的标准操作。这个平台俨然成了厂商们的“PR前沿阵地”。前两天阿里Qwen3.6发布，宣传登上OpenRouter榜首；小米MiMo此前也做过类似宣传。这都是免费试用带来的热度。

从这个角度看，龙虾“耗token”的特性，甚至可以被理解为一种“特色功能”。大模型研发门槛极高，但模型供给本身并不稀缺，关键在于用户用不用。龙虾把“性价比”这个杠杆，放大成了真正的竞争力。

数据不会说谎。MiniMax去年总收入7900万美元，而在龙虾爆火后的今年2月，其年度经常性收入（ARR）已超过1.5亿美元。月之暗面发布K2.5模型后，不到20天收入超过去年全年，且海外收入首次反超国内。

AI正在推动千行百业变革，但就其自身而言，独立的盈利闭环至今仍未完全跑通。OpenAI和Anthropic收入增长迅猛，但能否覆盖天价的研发与资本开支，仍是未知数。至于智谱、MiniMax、月之暗面等公司，距离形成稳健的商业模式则更为遥远。

在这种情况下，“叙事”能力就成了生存的要义。而叙事不能只靠蓝图，模型厂商的第一性原理永远是：模型得有人用。没人用，故事就讲不下去；用的人越来越多，故事才会圆满。

资本市场的反馈很直接。月之暗面去年底估值43亿美元，如今正以180亿美元寻求融资，翻了四倍多。智谱今日收盘价780港元，是其1月IPO发行价116港元的6.7倍。MiniMax的股价也从165港元的发行价，来到了950港元附近，涨幅接近6倍。

所以，账不能只算在token上。

02

在成本和规模的双重压力下，部分二线模型厂商已有提价动作。但这并不意味着价格战会就此熄火，竞争远未到终局。

小米的处境比较独特。它拥有完整的产品矩阵和硬件生态，MiMo的首要使命是融入并赋能这个既有生态。即便不对外售卖token，小爱同学、智能手机、小米汽车乃至庞大的IoT设备网络，都已经为MiMo提供了广阔的施展空间。

而智谱、MiniMax、月之暗面们则面临另一番景象。它们虽有C端产品，但这条赛道竞争异常惨烈。目前看来，在独立的AI应用领域，无论是通用助手还是垂直场景，字节、腾讯和阿里都具备碾压性优势，且争夺市场的意志坚决。

相较之下，通过API售卖token的生意，看上去似乎更“清爽”一些——尽管也只是相对而言。因为这更纯粹地比拼模型质量。然而，腾讯和Meta的经验表明，模型研发的成功，并非只靠资金和资源堆砌。

但必须清醒认识到，龙虾带来的“窗口期”不会无限期延续。

如果龙虾只是一阵风，热潮过后便消散，那么二线厂商自然无法再依赖这个出货渠道。

如果龙虾代表的不仅仅是一个工具的流行，而是一种C端AI产品的可行范式，那么，拥有流量、分发渠道和用户信任的科技巨头一定会出手。它们会推出自己的竞品来收割市场，并且必然会优先使用自家训练的模型，而非采购二线厂商的API。

模型与产品深度结合，已是明确的大趋势。阿里为了打通千问App与通义模型研发团队，引发了组织调整和人事震荡。姚顺雨入职腾讯后，首要任务也是推动团队整合，弥合研发与产品之间的鸿沟。

罗福莉批评龙虾浪费token时，提到了Claude Code在上下文管理上的工程优化，这恰恰是另一个产品与模型需要深度打通的典型案例。

龙虾在架构上的天然缺陷，导致每次工具调用都携带完整的长上下文发起独立请求，用户一个操作可能在后台触发十几轮API调用。这不仅烧钱，也带来延迟和不确定性。反观Claude Code，它对上下文进行精细管理，懂得何时压缩历史、何时截断，如何在保留任务状态的同时剔除冗余信息。

这背后，是Anthropic对自己模型能力边界的深刻理解。只有模型的研发者，才能将产品与模型调优成一个浑然天成的整体。

AI产品的第一代范式，是将模型作为通用API，产品只是套在外面的壳。这一范式催生了龙虾，也催生了无数套壳应用。它降低了创业门槛，但也造成了巨大的效率折损。产品不理解模型，模型不适配产品，两边都在用“蛮力”弥补彼此的信息差。

如今，第二代范式正在浮现：模型与产品从架构层面深度整合，共同设计。Claude Code提供了一个样本——模型不再是被调用的“黑箱服务”，而是产品本身不可分割的一部分。

在这一趋势下，纯粹的模型API厂商面临的挤压感会越来越强。“没有产品”可能成为它们的阿喀琉斯之踵。如果未来的核心竞争力源自模型与应用层的深度咬合，那么单纯在API层面比拼价格，无异于一场慢性消耗战。

行业里常讲“模型即产品”，用这句话来强调模型的基础性价值，当然没问题。但除非你的商业模式真的只卖API，否则，模型始终是产品的一个组成部分，而非产品的全部。两者的关系，正在从松散的“调用”走向紧密的“融合”。这才是关键所在。

本文转载于：https://www.tmtpost.com/7943003.html 如有侵犯，请联系zhengruancom@outlook.com删除。
免责声明：正软商城发布此文仅为传递信息，不代表正软商城认同其观点或证实其描述。

上一篇：《浪姐》的七年之痒

下一篇：浏览器历史记录删除了怎么恢复?找回已删除浏览器访问记录的方法

产品推荐

售后无忧
立即购买>

DAEMON Tools Lite 10【序列号终身授权 + 中文版 + Win】

￥150.00
office旗舰店
售后无忧
立即购买>

DAEMON Tools Ultra 5【序列号终身授权 + 中文版 + Win】

￥198.00
office旗舰店
售后无忧
立即购买>

DAEMON Tools Pro 8【序列号终身授权 + 中文版 + Win】

￥189.00
office旗舰店
售后无忧
立即购买>

CorelDRAW X8 简体中文【标准版 + Win】

￥1788.00
office旗舰店

正版软件

微软发布《对Windows质量的承诺》：全面优化Windows 11性能、可靠性与用户体验

我们对Windows质量的承诺最近，微软Windows + Devices部门的负责人Pa van Da vuluri，联合Windows Insider项目团队，发布了一份相当扎实的公告。这份题为《我们对Windows质量的承诺》的声明，可以说为Windows 11的未来发展定下了清晰的调子。核

6分钟前 0
正版软件

告别卡顿！华硕5070显卡助力AI创作速度飞起

当下的AI图像与视频生成：从指令跟随到工作流掌控如今，视觉生成AI领域正经历一场明显的转变。图像模型已经能稳定地产出逼真写实的画面，而视频模型则在生成长度与连贯性上不断突破。更关键的是，它们都越来越“听话”，能够精准地遵循创作指令。对于创作者而言，重点已不仅仅是感叹技术的奇妙，而是如何将其高效地融

6分钟前 0
正版软件

2026负离子吹风机推荐：3款高口碑护发款实测

核心观点总结说到底，一台真正靠谱的负离子吹风机，它的护发效果并非来自“负离子”这个概念的简单叠加。关键在于三个硬指标：真实有效的负离子浓度、与之匹配的气流与温控技术，以及必不可少的安全认证。只有三者协同，才能发挥实效。合格的高浓度负离子产品，确实能有效中和发丝静电、抚平毛鳞片，显著改善毛躁打结的问

7分钟前 0
正版软件

荣耀X80i开启预售：1999元起 4月10日正式开售

荣耀X80i近日上市并开启预售，售价1999元起，国补后到手价1699.15元起，将于4月10日正式开售。轻薄机身与旗舰工艺先看外观。这次荣耀X80i提供了流沙粉、青柠绿、月影白、曜石黑四款配色，选择空间不小。手感方面，堪称一大亮点——整机厚度薄至7.34毫米，重量控制在185克，拿在手里感觉相

14分钟前 0
正版软件

听声锁敌，战场集结！ROG电竞耳机带你畅玩《三角洲行动》

《三角洲行动》玩家们注意了，赛季挑战“蝶变行动”火热开启中想在战场上发挥稳定，一套性能出色的游戏装备至关重要，尤其是那双能“听风辨位”的耳朵。趁着赛季火热，咱们来盘一盘三款专为FPS游戏打造的ROG电竞耳机，看看哪款更能成为你的制胜利器。 ROG臻世游戏耳机：为发烧级音质而生如果你对声音细节有着

14分钟前 0

不能只算token账

01

02

产品推荐

最新发布

相关推荐

热门关注