智算多多
官方邮箱:service@zsdodo.com

公司地址:北京市丰台区南四环西路188号总部基地三区国联股份数字经济总部


京公网安备11010602202532号 “大厂涨跌都是营销行为,真正的公允价是市场来决定。”北京物联网智能技术应用协会副会长、中关村大数据产业联盟副秘书长颜阳向记者表示,中低端、泛用型的词元价格将不可逆地走向“免费化”和“白菜价”,但代表行业天花板的、具备超级推理能力的顶级旗舰词元,短期内依然存在局部上调或保持高位的可能。
对于降价原因,小米公司表示,由于在推理系统上的持续优化,在模型架构上积极的创新,从而降低了理论成本。同时,通过优化专家并行方案、输入长度分桶策略等,进一步提升了计算集群输入吞吐能力,从而在保障服务质量的前提下持续降低单位词元服务成本。不过,小米公司也表示,市场“Token贵”的反响,还有一部分原因是头部大模型的参数量、上下文越来越长,越强大的模型本身推理一次的成本也就越高。
事实上,词元作为AI时代的基础计量单位,正从纯技术概念演变为像“水电气”一样不可或缺的资源。“Token贵”是今年以来很多AI使用者的“体感温度”。
“感受到一定压力,Token价格上涨会影响我们的文本策划、脚本、分镜和提示词优化成本。”武汉杨涵涵文化传媒有限公司公共关系负责人刘畅告诉记者,对AIGC内容制作公司来说,成本压力并不只来自“Token单价”,而是来自整个AI内容生产链条的综合成本上升。
“虽然现在国产模型也有很多比较便宜的选择,但真正让我觉得贵的,是你不知道它什么时候会突然变贵。”武汉大学信息管理学院学生小李的经历颇具代表性。他告诉记者,自己已经从按量充Token转向订阅制服务,但额度限制和不可预测的成本依然困扰着他。
清程极智联合创始人师天麾在接受记者采访时表示,去年各大模型厂商折扣力度较大,但今年明显收紧。“今年有的厂商即便买很大的量都不打折,在紧缺的时候甚至要加价去买Token。”
“尽管有的大厂为了抢客户会大幅降价,但赔本赚吆喝是不可持续的。”颜阳分析认为,涨价背后不仅是硬件成本压力,还有三笔“隐形账”:前期“价格战”的理性回归、高质量数据原材料价格上涨,以及安全合规成本的增加。“大部分厂家的涨价其实是商业模式在向健康、可持续的方向回归。”
“Token贵的本质是因为供需关系失衡。”师天麾指出,今年Token需求量增长很快,DeepSeek迭代更带来了新的爆发,但算力总量的增长远不及此。
这一矛盾直接传导至服务质量。师天麾团队长期对云服务商进行评测,发现近几个月服务质量“明显变差”——原来3至5秒能返回的调用,现在十几秒、30秒甚至上百秒的情况经常出现。“用户的调用量太大,服务商那边资源不够,大家就去抢资源、去排队,本质上还是Token产量不够,或者说算力不够导致的。”
更值得关注的是,大客户已开始提前锁定产能。“一些大企业已经把很大一部分Token产量预定得七七八八了。”师天麾透露,这种“抢跑”现象,或将加剧中小企业的算力获取难度。
对于普通用户而言,对于Token贵的焦虑不仅在于价格本身,更在于成本的不透明与不可控。
小李描述了使用AI Agent时的典型困境:“让它改一个项目、读一堆文件、跑测试、总结错误,它每一步都要消耗Token。失败一次再重试,Token就会滚得很快。”更让他焦虑的是成本难以预测——“一个任务开始前,我不知道它最后会花5毛、5块,还是更多。任务做到一半的时候也很尴尬:已经花了不少Token,不继续感觉前面都浪费了,继续又怕越陷越深。”
你说你给我用的是这个模型,但到底是不是真的是这个模型,我是不知道的。
这种“黑盒”特性也让行业乱象难以根治。师天麾指出,有些服务平台其实就是一个“黑盒”——用户输入信息、获得返回,但中间过程完全不可见。“你说你给我用的是这个模型,但到底是不是真的是这个模型,我是不知道的。”用户感觉模型“变笨”了,却难以验证和维权,“花了一样钱结果被坑了”的情况时有发生。
小李的期待则更为朴素:Token不一定要越便宜越好,更重要的是透明和可控。“比如任务开始前能不能给一个预算预估,快超预算的时候提醒我,告诉我哪些步骤最耗Token,或者允许我设置一个上限。”
面对“Token贵”困局,产业链各方正在探索多元破解路径。
制度创新层面,国家数据局近期在政策中首次明确提出“探索词元(Token)交易等新型交易模式”。颜阳认为,这将使AI资源彻底解耦,变成“按滴计费”的水电模式,“企业用多少、买多少,成本能实现精确到分厘的精细化控制”。
基础设施层面,三大运营商近期纷纷上线超低价Token套餐,颜阳认为这将起到“定海神针”作用。更深层逻辑在于“东数西算”战略——运营商在西部用廉价绿电建设“Token工厂”,通过“算电协同”从能源源头对冲高端芯片溢价。不过师天麾也提醒,运营商的技术优化能力“在行业里肯定不是顶尖的”,其低价策略更多是大批量采购的成本优势,且仍存在“黑盒”问题。
工程创新层面,“大小模型混合编队”和智能路由技术成为降本新思路。师天麾介绍,清程极智的AIP智能路由系统通过7×24小时不间断评测,将用户请求自动导向服务质量最优、成本最低的服务商;同时采用模型组合策略——小模型处理80%常规业务,大模型专攻20%核心逻辑,不必挤在一个模型上。
“从长期来看,Token的价格还是要降下来的。”师天麾判断,“在中国,它要成为AI时代的水电,那就会像水电一样便宜。”他对国产硬件充满信心:“中国芯片过些年就会像手机、汽车一样,在全世界都是性价比非常高的。”
颜阳建议,政府层面应“搭舞台”而非“限票价”:精准发放“词元券/算力券”补贴初创团队,推动公共数据合规开放以降低“饲料价格”,同时扶持国产大模型工程生态与智能体安全环境。
对于中小企业,师天麾建议采取“先探天花板、再找最优价”的两步走策略:先用最好的模型了解AI在当前阶段能达到的效果上限,再在业务稳定后尝试换用更小、更便宜的模型,摸索效果与成本的最佳平衡点。
“降本不能只靠某一个环节,而是需要产业链协同。”刘畅表示,从产业发展角度看,Token成本下降会直接推动AI应用普及。只有让更多中小企业和内容团队用得起、用得稳、用得好,AI才能真正从技术热点变成产业生产力。
