智算多多



2025 年以来的智谱,正在起飞。
2025 年 7.2 亿元的营收,比 2024 年的 3.1 亿元,翻了一倍。动力引擎在于,智谱的业务模式,正在从 "重" 切换到 "轻"。
要理解这个变化,可以把智谱想象成一家电力公司。
过去,智谱主要做的是 "卖发电机" 的生意——也就是本地化部署,把 AI 大模型直接部署在政府、国企、金融机构等大客户的自家服务器上。
这种模式利润不低,2024 年毛利率高达 66%,而且客户粘性高。但问题也很明显:它是个 "项目制" 的生意,每接一个大单都得专门派团队上门服务,交付周期长、人效比较低,很难实现指数级增长。
从财报数据中就能看到其中的苦与累。截至 2025 年末,智谱的应收款项约为 3.39 亿元人民币,占其全年 7.24 亿元营收的近 47%。而且,其销售及营销费用高达 3.91 亿元人民币,几乎是其云端部署业务全年收入的两倍。
这显然不是一项 "性感" 的生意,要想实现腾飞,必须寻找第二增长曲线。
而现在,智谱正切换成 AI 时代的 "卖电" 生意——也就是云端 API 服务。客户不需要自己买 "发电机",直接用平台上的 "电力" 就好,按照 "用电量"(即 Token 消耗量)付费。
这种模式标准化程度高,增长不依赖于人力扩张,而是取决于 "用电" 规模。这种 "卖电" 模式比 "卖发电机" 的想象空间大多了。
这一点,在财报中体现得尤为清晰。2025 年,智谱的本地化部署占据收入的 73.7%,增速为 102.3%,而云端部署收入虽仅有 1.90 亿元的体量,但同比大增了 292.6%。
本地化部署仍是智谱当下的现金牛,但云端 API 才是未来的增长引擎。
不过,转型并非没有代价。
云端业务的毛利率虽然已经从 2024 年的 3.3% 大幅改善到 18.9%,但相比本地化部署的 48.8%,还是差了一大截。与此同时,本地化部署因为客户要求更高、交付成本上升,毛利率也从前一年的 66% 大幅下滑。智谱 2025 年的整体毛利率从 56.3% 暴跌至 41%,整整少了 15 个百分点。
这是一种典型的结构性阵痛:为了转型,不得不忍受利润率的暂时性下滑。
不过,代价都是可以弥补的,智谱展现了更值得期待的想象空间。
2024 年下半年至 2025 年初,中国大模型市场深陷价格战——字节豆包报价低至 0.0008 元 / 千 tokens,智谱自己也曾将 GLM-4-Plus 降价 90%。
2026 年一季度,智谱率先打破了这个叙事,其 API 服务涨价了 83%,结果却有更多人买单,调用量大涨 400%。
一方面,智谱在保持技术性能的同时,价格相对国内外部分厂商更具竞争力,尤其对高 Token 消耗场景提供了更经济的解决方案;另一方面,国内企业出于数据安全、本地化支持及成本考虑,可能更倾向选择国产平替。
模型的定价权是由我们的技术实力,以及长期趋势所带来的领先地位决定的。
3 月 31 日晚,智谱 CEO 张鹏回应了智谱模型连续涨价的考量。
他认为,当模型足够强,API 本身就是最好的商业模式。
这条路径,已经在海外被验证过,正是智谱对标的 Anthropic。
作为美国 AI 公司中 API 商业模式的典型代表,Anthropic 的核心路径就是贩卖最强模型的价值。
目前,Anthropic 服务的企业客户已超过 30 万家。过去三年,其每年收入增长都超过 10 倍,据最新的披露数据,Anthropic 的年化收入(ARR)已达 300 亿美元,超过了 OpenAI,"史上增长最快的企业软件公司" 名副其实。
智谱想在中国进行复刻,但事情有那么简单吗?
"中国版 Anthropic" 确实是个吸引人的故事,故事的结局走向何方,不是现在能定论的。
毕竟 "龙虾" 从火爆一时,到被质疑,乃至被 Anthropic 封禁,意味着 AI 行业还处于不断调整的探索期。
智谱虽在尽快调整业务方向,不断提高技术能力,但最后一公里的 "智能上界" 才是真正的分水岭。
这是智谱正在推崇的概念,其提出一个公式:AGI 商业价值 = 智能上界 × Token 消耗规模。这与 MiniMax 提出的 "智能密度 × Token 吞吐量" 或有异曲同工之妙。
本质上,都不想做一个只卖 API 的公司,而是要向上延伸,重新构建系统,定义标准,打造以 Token 消耗量驱动的 AI 时代商业模式。
在 2025 年财报里,智谱验证了两条路径:云端 API 业务增势迅猛,ARR 证明了规模效应;客户愿意为更贵的 "智能上界" 买单,验证了智谱的定价权。
不过,这是否就意味着能跑通 "模型能力 -API 调用 - 收入增长 - 反哺研发" 的商业模式?
逻辑很顺滑,但现实很骨感。
调用量的增长,虽然会带来收入增长,但并不会帮助降低成本,增长越快,成本压力反而越大。
4 月 4 日,Anthropic 宣布,Claude 的订阅额度不再支持 OpenClaw 等第三方工具使用。
有用户表示,Openclaw 是 Token 无底洞,订阅制 Token 根本扛不住:"任务开始后,每次只能调用一个工具等着反馈再调用下一个,一个任务下来,几十上百万 Token 就进去了。" 与此同时,小米罗福莉也发文提醒业内 Agent 算力分配与定价逻辑。
而且,要保持大模型的高水准,研发投入也必然长期处于高位。
2025 年,智谱研发开支达到 31.8 亿元,同比增长 44.9%。这意味着,公司每赚 1 元钱,就要花掉 4.4 元在研发上。这也是造成智谱全年亏损 47.18 亿元,同比扩大 59.5% 的主要原因。
智谱目前受益于高 Token 消耗场景(如长文本处理、多轮对话等)的需求增长。要保持红利的可持续性,还需要持续优化模型效率以优化成本,并且开拓更多高附加值场景,如垂直行业定制、多模态应用等。
而在投入与产出上,智谱与 Anthropic 的差距,宛若鸿沟。
Anthropic 是当下 AI 行业最惊人的增长案例。一年多时间,ARR 从 10 亿美元冲到 300 亿美元。其中,80% 的收入来自企业用户,这得益于美国充分的付费习惯土壤,美国企业每年花数千亿美元在软件预算上。
而智谱的 MaaS 业务 ARR 约为 2.5 亿美元,这还是在过去 12 个月增长 60 倍的情况下,与 Anthropic 相比尚处于完全不同的量级。
智谱要让 "中国版 Anthropic" 的故事落地,继续践行 AGI 价值公式,一定要持续提高智能上界,才能扩大 Token 消耗规模,并保持自己的定价权。
Anthropic 在模型安全、对齐研究等领域领先,而智谱需要加强技术攻关和国际化布局。
与拥有重资产自主算力布局的互联网大厂相比,智谱还需要保持在技术与应用层的壁垒,维持在模型层的极强竞争力,才能吸引客户长期买单。
最近,在被称为 "软件工程能力试金石" 的 SWE-bench Pro 基准测试中,智谱的开源模型 GLM-5.1 刷新了全球最佳成绩,直接超越 Claude Opus 4.6、GPT-5.4 等一众头部模型,拿下全球第一。
但在大模型的金字塔尖,向来 "各领风骚三五月",世界上已经没有一个公认的、能长时间稳坐的 "最强大模型" 了。
在这个群雄并起的时代,智谱能不能把故事讲好,市场都会拭目以待。