智算多多联系我们


关注我们

公众号

视频号
隐私协议用户协议
◎ 2025 北京智算多多科技有限公司版权所有京ICP备 2025150592号-1
一是硬件成本“逆向”暴涨。高带宽内存(HBM)存储与高端芯片处于绝对卖方市场,2026年第一季度存储价格翻倍,硬件采购及运维成本高企。
二是需求结构从训练转向推理。随着AI智能体爆发,推理端的Token调用量激增。推理属于持续性运营支出,海量并发带来的电力和带宽成本已超出云厂商的补贴上限。
三是商业模式从“圈地”转向“盈利”。早期算力价格战已完成初步生态绑定,在财务压力下,厂商必须通过提价来覆盖昂贵的算力折旧。
四是算力资源的战略性稀缺。全球高端算力租赁容量告急,电力配额紧张,供需极度失衡,导致价格失去下行空间。
此前两年多时间里,云厂商以“烧钱换市场”的逻辑持续降价,Token成本被压缩至每百万Token不到一元。但当前,复杂推理让单日调用费用高达数百元,价格不断上涨,此前大模型的免费公测也同步结束。