首页
产品服务
模型广场
Token工厂
算力市场算力商情行业资讯
注册

小米跟了DeepSeek价格战!直降99%,全面对标

发布日期:2026-05-28 来源:澎湃新闻(智东西)作者:澎湃新闻(智东西)浏览:2

Token Plan大改版:套餐容量提升5-8倍

  除了API永久降价,这次变化最大的,其实是Token Plan套餐体系。

  小米称,新版计费规则进行了重新梳理,在价格不变的情况下,套餐Credits大幅提升,用量普遍达到原来的5-8倍。

  从我们梳理的国内主流大模型订阅制套餐来看,小米此次调整后,入门档方面,小米Lite套餐与Kimi、字节、阶跃星辰等厂商的最低档位接近,但并不是市场最低,腾讯混元Hy目前仍有28元/月的Lite档。

  而高阶档方面,小米Max套餐也并非最高。目前阿里尊享版达到1398元/月,字节Agent Plan Max档位为950元/月,MiniMax Ultra极速版则接近750元/月。

国内大模型订阅制套餐价格对比(智东西制表,统计截止时间为:2026/05/27)
国内大模型订阅制套餐价格对比(智东西制表,统计截止时间为:2026/05/27)

  与此同时,小米还公布了新版Credits与Token换算关系,并公开给出了高缓存命中场景下,不同套餐大致对应的实际Token规模。

小米MiMo Credits与Token换算关系
小米MiMo Credits与Token换算关系
小米MiMo Credits与Token换算关系

  按照小米给出的95%以上缓存命中场景测算,如果使用MiMo-V2.5,39元Lite套餐理论上已经可以跑到5亿Token以上,99元Standard档位超过13亿Token,329元Pro档位达到47亿Token以上,659元Max档位则突破100亿Token。

  即便是更贵的MiMo-V2.5-Pro,在高缓存命中场景下,39元Lite档位也能达到1.9亿Token以上,99元套餐超过5亿Token,329元档位约18亿Token,659元Max档位则接近40亿Token。

  小米特别强调,在Agent与Code类场景下,由于缓存命中率通常更高,实际可使用Token数量会明显增加。

  小米"百万亿Token创造者激励计划"也一度引发开发者圈关注。小米披露,截至5月26日下午4点08分,100T Tokens已经全部提前发放完毕,活动提前收官。所有当前仍在有效期内的Token Plan用户,无论此前套餐已经使用到什么程度,其Credits额度都将在5月27日0点全部重置,并自动切换至新计费规则。

  针对已经过期的历史付费用户,小米后续也将提供额外福利。

小米为什么敢降价?推理系统上的持续优化

  这次小米也专门解释了背后的推理优化方案。

  小米团队基于SGLang HiCache完整支持SWA(Sliding Window Attention),将KV Cache在GPU显存、CPU内存、SSD等多级存储间的数据搬运量降低至优化前的约1/7,可缓存Token数量提升至约5倍。与此同时,小米还优化了专家并行方案、输入长度分桶策略等机制,进一步提升集群输入吞吐能力,从而降低单位Token成本。

  简单来说,小米这次的核心逻辑其实和DeepSeek类似:一边是更激进的缓存命中策略,一边是更高的推理吞吐效率。

  价格战背后,本质仍然是推理系统与基础设施能力的竞争。

模型能力进入前排后,小米MiMo补上价格牌

  今年4月23日,小米正式开启Xiaomi MiMo-V2.5系列大模型公测,推出MiMo-V2.5、V2.5-Pro、V2.5-TTS Series以及V2.5-ASR等多个版本。其中,MiMo-V2.5-Pro重点面向Agent、复杂软件工程以及长程任务等场景。

  目前,MiMo-V2.5-Pro在Artificial Analysis综合智能榜中位列全球开源模型并列第一,同时进入全球大模型总榜前五;其Agent指数同样位列全球开源模型并列第一。

  4月28日,小米进一步将MiMo-V2.5系列以MIT协议正式开源,支持商用部署与二次训练,无需额外授权。

  而真正让MiMo在开发者圈快速出圈的,还是此前那轮"100万亿Token免费计划"。

  5月9日,Hermes Agent("爱马仕")首次超越OpenClaw("龙虾"),登顶OpenRouter全球应用调用量榜首。当时,Hermes月调用量排名前五的模型中,MiMo-V2-Pro排在第一,后面依次是MiniMax M2.7、英伟达Nemotron 3 Super、阶跃星辰Step 3.5 Flash以及腾讯Hy3 preview。

  不过,榜单变化也非常快。

  截至5月27日上午9点,OpenRouter本周调用榜中,MiMo-V2.5-Pro位列第十四;

OpenRouter本周调用榜(截至5月27日上午9点)
OpenRouter本周调用榜(截至5月27日上午9点)

  在Hermes Agent模型月调用榜里,MiMo-V2-Pro也已从此前榜首掉到第16名。

(图源:OpenRouter,截至5月27日上午9点)
(图源:OpenRouter,截至5月27日上午9点)

  目前排名前三的分别是DeepSeek-V4-Flash、匿名模型Owl Alpha以及DeepSeek-V4-Pro。

(图源:OpenRouter,截至5月27日上午9点)
(图源:OpenRouter,截至5月27日上午9点)

  某种程度上,这也能看出当前国内大模型竞争的激烈程度:一边是榜单和调用量变化越来越快,另一边,则是价格战开始直接靠拢DeepSeek的"地板价"。

结语:营收利润双降后,小米还是下场打起了价格战

  价格战之外,小米昨日的财报,也让这轮降价多了一层"大放血"的意味。一季度,小米营收991亿元,同比下降10.9%;经调整净利润61亿元,同比下降43.1%。

  另一边,小米对AI的投入并没有放缓。财报显示,其当季研发开支达到90亿元,同比增长33.4%;截至2026年3月31日,小米研发人员数量达到26048人,创下历史新高。

  小米管理层也在财报会上频繁提到AI。当被问到雷军此前提出的160亿元AI投资计划时,小米集团CFO林世伟认为未来对于AI的投资计划会根据AI业务的发展状况进行调整,预期会有所上涨。

  卢伟冰则专门提到,在当前内存上涨周期里,"抓住AI非常重要"。

  从MiMo开源、100万亿Token免费计划,到冲击OpenRouter Agent榜单,再到如今直接跟进DeepSeek永久降价,小米过去一个多月在AI上的动作明显频繁。而随着国内模型价格继续下探,这场竞争也已经不只是模型能力本身的比拼,背后更是一场围绕推理系统、算力效率以及长期资金投入的持续消耗战。

本文转载自澎湃新闻(智东西), 作者:澎湃新闻(智东西), 原文标题:《 小米跟了DeepSeek价格战!直降99%,全面对标 》, 原文链接: https://m.thepaper.cn/newsDetail_forward_33244845。 本平台仅做分享和推荐,不涉及任何商业用途。文章版权归原作者所有。如涉及作品内容、版权和其它问题,请与我们联系,我们将在第一时间删除内容!
本文相关推荐
暂无相关推荐
点击立即订阅