小米Mimo大模型大幅降价至99%
2026-05-27
小米旗下大模型Mimo近日宣布对API价格体系进行全面调整,推出长期有效的降价策略,部分核心模型调用成本最高下降接近99%。这一变化不仅直接影响开发者使用成本,也意味着国内大模型市场在商业化路径上再次出现明显的价格重构信号,在AI应用快速扩张的背景下具有较强的行业参考意义。
从具体调整内容来看,此次降价覆盖多个版本的模型接口。其中,Mimo-v2.5-pro在输入缓存命中场景下的价格被压缩至每百万tokens约0.0036美元,较此前标准大幅下调,长文本处理成本下降幅度达到99%左右。基础版本Mimo-v2.5同样进行了同步调整,其输入缓存命中价格降至每百万tokens约0.0028美元,整体计费水平相比旧体系下降约98%。值得注意的是,这次并非阶段性促销,而是被定义为“永久性调整”,意味着价格结构将长期维持在新的低位水平。
与此同时,小米还对订阅套餐体系进行了同步升级,在维持原有月费不变的情况下,大幅提升了可用点数额度,不同档位分别提升至41亿、110亿、380亿以及820亿点。对于现有用户,公司还一次性进行了历史额度的全额重置,这一动作在行业中并不常见,等于直接提升了存量用户的实际可用算力资源。从产品逻辑来看,这种“降价+扩容”的组合,更像是在加速开发者生态的规模化铺开。
这轮调整背后的行业意义并不局限于单一企业策略,而更接近AI基础设施竞争进入新阶段的体现。一方面,大模型训练与推理成本随着硬件优化和工程效率提升持续下降,使得“算力平价化”逐渐成为可能;另一方面,应用侧竞争正在加剧,厂商更倾向通过极低的API价格换取更大的开发者生态与调用规模。在这种背景下,价格不再只是收入工具,而成为争夺生态入口的重要手段。一个明显变化是,大模型服务正在从“按能力定价”逐步转向“按规模换市场”。
从行业横向对比来看,类似的降价趋势在全球范围内已经有所显现,但如此大幅度、且明确长期化的价格重置仍然较为少见。过去一年中,多家AI公司通过压缩token成本、提升缓存命中效率以及优化推理架构来降低使用门槛,但通常以渐进式调整为主。而此次Mimo的策略更激进,几乎是一次性将成本曲线拉至新区间,这也可能对同类产品形成一定价格压力,推动行业进一步进入“低成本普及阶段”。同时,开发者对多模型调用、组合式AI应用的需求也可能因此加速释放。
整体来看,小米此次对Mimo大模型的价格体系重构,不仅是一次商业策略调整,更像是对AI应用普及节奏的一次加速推动。随着成本持续下探、订阅资源扩容以及生态门槛降低,模型能力的竞争焦点可能会进一步从“谁更强”转向“谁更便宜且更易用”。如果这一趋势延续,大模型行业在未来一段时间内或将进入以规模扩张为核心的新竞争周期,而价格下行或将成为常态,而非阶段性现象。
