模型降价潮之后，AI开销账单出现了新的矛盾-Seo优化-塔城地区网站建设公司

模型降价潮之后，AI开销账单出现了新的矛盾

5月下旬到6月初，国内几家大模型厂商集中调了价。

5月22日，DeepSeek把V4-Pro的每百万token价格压到原来的四分之一左右。隔了五天，小米MiMo-V2.5系列跟上，输入缓存命中降了99%，输出降了86%。进入6月，腾讯云跟进，DeepSeek-V4-Pro推理输入输出各降75%，缓存命中价格从0.001元/千tokens砍到了0.000025元。

三家出手的幅度和节奏都很快。单看这些数字，AI推理似乎已经逼近水电定价了。

但翻一下这几个月的实际AI支出记录，事情没那么简单。降价新闻刷屏的时候，月费账单并没有成比例地缩水。

用量增速盖过了单价降速

降价只是等式的一边。另一边是用量。

证券时报6月24日报道，某互联网龙头的大模型日均Token调用量已突破180万亿，较发布时增长超1500倍，过去一年增长超10倍。证券时报的原文用了"跨越质变点"——AI调用从试用阶段进入了生产级大规模调用。

单价降了75%到99%，用量涨了10倍以上。两条线交叉之后，总花费的变化方向和降价数字暗示的方向并不重合。

这种矛盾在不同使用强度下表现不一样。轻度使用场景中（月均50万token级别），订阅费是大头，API降价几乎没有影响——订阅费没动，月账单纹丝不动。中度使用场景（月均500万token级别），API支出确实在降，半年前约50元/月，现在约12.5元/月，但同期用量翻了不止一倍，省下来的被用量增量吃掉了一大半。重度使用场景（Agent开发、自动化工作流、月均3000万token以上）的问题更突出：调用量翻了5倍，API单价降了75%，总API支出跟半年前差不多，而新增的工具订阅还在往上堆。

问题不是单价有没有降——单价确实降了。问题是每月实际付出去的钱，跟"降价99%"这个数字制造的心理预期之间，有一道不小的落差。订阅费在这道落差里占了很大比重：不降价，但你也不太会退订。

容易被忽略的几笔成本

除了"单价×用量"这个基础算式，还有几个少有人算的支出项。

工具切换的摩擦。模型降价之后，一部分工作可能从原来的工具搬到了其他平台，又为了特定任务开了新的API。每多一个工具，就多一套计费规则要搞明白、多一个后台要管。省下来的API费用，有一部分被管理成本吞回去了。

Agent的调用乘法。搜狐科技6月26日的一篇分析提到一个容易被忽略的逻辑：模型降价某种程度上是在给Agent生态铺路。Agent做一次多步任务，背后是几十上百次模型调用。Agent能力越强，用得越猛，调用次数就指数级上升——降价省的那部分，被更多次的调用消化掉了。

芯片制造成本的上升压力。华泰证券6月17日研报指出，AI芯片综合成本可能上涨30-50%。HBM存储占据芯片成本约45%，预计价格还要涨。世界经济论坛达沃斯2026年年报的数据显示，推理成本3年跌了97%，剩下的降价空间越来越窄。而芯片制造成本中枢在上移，两股力量在对冲，API继续大幅降价的窗口在收窄。如果芯片成本持续上移而API降价止步，用量还在涨——月费账单的走向就不好说了。

定价表上的箭头一路向下，用量曲线一路向上。两条线交叉出来的结论，不是"AI越来越便宜了"那么简单——单价在降，但每月实际开销未必降，对重度使用场景来说甚至还在涨。

180万亿Token、增长1500倍这个数字摆在面前的时候，AI在按单价变便宜是事实，但打开账单看总金额是另一回事。

🔑

DARTS 在靶标鉴定中的优势分析

在当前的化学生物学研究中，药物靶标鉴定 (Target Identification) 是连接表型发现与机制解析的桥梁。传统的亲和色谱法等技术通常依赖于药物分子的共价标记或探针修饰。然而，对于许多结构精密的活性分子，尤其是从植物中提取的天然产物&#x…

李华

别再只会用SUBSTRING了！用MySQL的regexp_substr()优雅拆分IP地址和复杂字符串

正则表达式在MySQL中的高阶应用：从IP拆分到日志解析的实战指南如果你还在用SUBSTRING_INDEX()或SUBSTR()配合一堆LOCATE()函数来拆分字符串，那就像用螺丝刀当锤子——能用但不顺手。MySQL的正则表达式函数家族（regexp_substr、regexp_replace…

李华

一文吃透前端 CI/CD：Azure Pipelines / Jenkins / GitHub Actions 实战对照（附完整配置）

📌你刚接手一个项目，在仓库根目录看到一个 azure-pipelines.yml，里面写满了 trigger、pool、task。这东西是干嘛的？能删吗？和Jenkins 是一回事吗？本文从一份真实在跑的前端部署流水线出发，把 CI…

李华

阿里云盘Refresh Token获取终极指南：3分钟扫码搞定云盘授权

阿里云盘Refresh Token获取终极指南：3分钟扫码搞定云盘授权【免费下载链接】aliyundriver-refresh-token QR Code扫码获取阿里云盘refresh token For Web 项目地址: https://gitcode.com/gh_mirrors/al/aliyundriver-refresh-token 想要安全地获取阿里云盘R…

李华

【Sora vs 可灵AI决策指南】：企业级视频生产选型必查的6个隐藏参数（含API吞吐量、长时序一致性、中文语义理解得分）

更多请点击： https://codechina.net 第一章：Sora vs 可灵AI：企业视频生成技术演进的分水岭当OpenAI发布Sora时，其120秒连贯物理模拟、高保真纹理建模与跨镜头一致性能力，标志着文本到视频（T2V&#xff09…

李华

别再手动切视频了！用Python的pyscenedetect库，5分钟搞定视频自动场景分割

别再手动切视频了！用Python的pyscenedetect库，5分钟搞定视频自动场景分割每次剪辑Vlog或游戏集锦时，最痛苦的就是反复拖动时间轴寻找剪辑点？试试这个藏在Python里的视频自动化神器——pyscenedetect。它能像人类一样感知画面突变&…

李华