模型降价潮之后,AI开销账单出现了新的矛盾
5月下旬到6月初,国内几家大模型厂商集中调了价。
5月22日,DeepSeek把V4-Pro的每百万token价格压到原来的四分之一左右。隔了五天,小米MiMo-V2.5系列跟上,输入缓存命中降了99%,输出降了86%。进入6月,腾讯云跟进,DeepSeek-V4-Pro推理输入输出各降75%,缓存命中价格从0.001元/千tokens砍到了0.000025元。
三家出手的幅度和节奏都很快。单看这些数字,AI推理似乎已经逼近水电定价了。
但翻一下这几个月的实际AI支出记录,事情没那么简单。降价新闻刷屏的时候,月费账单并没有成比例地缩水。
用量增速盖过了单价降速
降价只是等式的一边。另一边是用量。
证券时报6月24日报道,某互联网龙头的大模型日均Token调用量已突破180万亿,较发布时增长超1500倍,过去一年增长超10倍。证券时报的原文用了"跨越质变点"——AI调用从试用阶段进入了生产级大规模调用。
单价降了75%到99%,用量涨了10倍以上。两条线交叉之后,总花费的变化方向和降价数字暗示的方向并不重合。
这种矛盾在不同使用强度下表现不一样。轻度使用场景中(月均50万token级别),订阅费是大头,API降价几乎没有影响——订阅费没动,月账单纹丝不动。中度使用场景(月均500万token级别),API支出确实在降,半年前约50元/月,现在约12.5元/月,但同期用量翻了不止一倍,省下来的被用量增量吃掉了一大半。重度使用场景(Agent开发、自动化工作流、月均3000万token以上)的问题更突出:调用量翻了5倍,API单价降了75%,总API支出跟半年前差不多,而新增的工具订阅还在往上堆。
问题不是单价有没有降——单价确实降了。问题是每月实际付出去的钱,跟"降价99%"这个数字制造的心理预期之间,有一道不小的落差。订阅费在这道落差里占了很大比重:不降价,但你也不太会退订。
容易被忽略的几笔成本
除了"单价×用量"这个基础算式,还有几个少有人算的支出项。
工具切换的摩擦。模型降价之后,一部分工作可能从原来的工具搬到了其他平台,又为了特定任务开了新的API。每多一个工具,就多一套计费规则要搞明白、多一个后台要管。省下来的API费用,有一部分被管理成本吞回去了。
Agent的调用乘法。搜狐科技6月26日的一篇分析提到一个容易被忽略的逻辑:模型降价某种程度上是在给Agent生态铺路。Agent做一次多步任务,背后是几十上百次模型调用。Agent能力越强,用得越猛,调用次数就指数级上升——降价省的那部分,被更多次的调用消化掉了。
芯片制造成本的上升压力。华泰证券6月17日研报指出,AI芯片综合成本可能上涨30-50%。HBM存储占据芯片成本约45%,预计价格还要涨。世界经济论坛达沃斯2026年年报的数据显示,推理成本3年跌了97%,剩下的降价空间越来越窄。而芯片制造成本中枢在上移,两股力量在对冲,API继续大幅降价的窗口在收窄。如果芯片成本持续上移而API降价止步,用量还在涨——月费账单的走向就不好说了。
定价表上的箭头一路向下,用量曲线一路向上。两条线交叉出来的结论,不是"AI越来越便宜了"那么简单——单价在降,但每月实际开销未必降,对重度使用场景来说甚至还在涨。
180万亿Token、增长1500倍这个数字摆在面前的时候,AI在按单价变便宜是事实,但打开账单看总金额是另一回事。
🔑