智算多多
官方邮箱:service@zsdodo.com

公司地址:北京市丰台区南四环西路188号总部基地三区国联股份数字经济总部


让我们先算一笔账。
Cloudflare Workers AI平台每天处理的推理请求数以百亿计。以GPT-4级别的模型为例,每百万Token的输入成本约为30美元,输出成本约为60美元。而Kimi K2.5的定价策略极具侵略性——输入价格仅为每百万Token 3美元,输出价格为每百万Token 12美元。
简单的数学:同等性能下,Kimi的成本仅为闭源竞品的20%-30%。
对于Cloudflare这样的基础设施巨头而言,这意味着每年数亿美元的直接成本节约。Matthew Prince在SXSW演讲中没有掩饰这一选择的商业逻辑:"企业客户不关心模型是谁训练的,他们只关心三件事——响应速度、准确率和账单金额。"
成本只是表面,性能才是内核。
Kimi K2.5之所以能够通过Cloudflare的严格技术评估,关键在于其在长文本处理(Long Context)领域的突破。该模型支持高达256,000 Token的上下文窗口,在特定测试场景下更可扩展至200万汉字——这意味着它可以一次性处理整本长篇小说、完整代码库或数小时的视频会议记录。
对于Cloudflare的B端客户(主要是SaaS公司和开发者)而言,这一能力直接转化为产品竞争力。想象一下:一个法律Tech产品可以一次性分析数百页的合同文本;一个代码助手可以理解整个项目的架构而非单个文件;一个客服机器人可以记住用户过去一年的所有交互记录。
Kimi在长文本领域的技术壁垒,成为了打破欧美客户"品牌偏见"的利器。
如果将大模型出海比作一场战役,那么DeepSeek打响的是"开源革命"的枪声,而五小龙正在打的是一场更为精细的"API渗透战"。
出海路径:To C产品建立品牌认知 → To B API实现商业变现
月之暗面的策略可以概括为"农村包围城市"。在国内市场,Kimi智能助手已经积累了超过2000万月活用户,其"支持200万字长文本"的卖点深入人心。这种C端品牌势能,为其B端API出海提供了天然的信任背书。
在海外市场,月之暗面采取了"农村包围城市"的策略:
关键数据:据OpenRouter平台数据,Kimi K2.5周调用量稳居全球前五;在Cloudflare上架后,海外开发者调用量持续增长,北美和欧洲市场贡献超过60%。
出海路径:开源模型建立生态 → 企业级服务收割价值
智谱AI的出海策略与其技术基因一脉相承——稳扎稳打,重视生态。
2024年,智谱先后开源了ChatGLM3-6B和GLM-4系列模型,在Hugging Face上的累计下载量超过3000万次。这一开源策略为其赢得了全球开发者社区的广泛认可。据智谱官方披露,其企业级API服务已覆盖超过50个国家和地区,海外收入占比从2024年初的5%提升至2026年初的35%。
智谱的核心优势在于其"全栈自研"的技术实力。从底层算子优化到上层应用框架,智谱拥有完整的自主知识产权。这在当前地缘政治日趋复杂的背景下,成为了其服务海外敏感行业客户(如金融、政务)的重要筹码。
出海路径:海外市场优先 → 边缘计算+端侧AI
作为四小龙中国际化基因最浓的团队,零一万物从成立之初就将出海作为核心战略。创始人李开复的全球人脉和视野,使其在海外市场拓展上拥有天然优势。
零一万物的差异化竞争点在于端侧AI。其推出的Yi系列模型在量化压缩后,可以在消费级GPU甚至高端CPU上流畅运行。这一特性使其在边缘计算、IoT设备和私有化部署场景中具有独特竞争力。
据OpenRouter平台早期数据(2026年3月),零一万物Yi-34B Chat占据平台约2.9%的市场份额,在中小开发者中性价比优势突出。其端侧推理场景占比较高,是五小龙中仅次于MiniMax的端侧AI代表。
出海路径:垂直场景切入 → 行业Know-how构建护城河
与前三者不同,百川智能选择了"垂直深耕"的出海路径。其重点发力的领域包括医疗、法律和金融——这些场景对模型的专业性和准确性要求极高,但客单价也相应更高。
百川的出海策略是"以点带面":先在新加坡、香港等华语文化圈地区建立标杆案例,再逐步渗透至欧美主流市场。其医疗大模型Baichuan-Med已通过新加坡HSA(卫生科学局)的初步审核,有望成为首个在海外获得医疗AI资质的国产大模型。
出海路径:To C应用出海 → 语音技术领先 → API生态构建
MiniMax(稀宇科技)是五小龙中国际化程度最高的一员。其推出的AI角色扮演应用Talkie(海外版星野)曾登顶全球AI伴侣类产品免费榜,2024年8月海外单月下载量曾达235万。虽然2025年四季度数据显示其月活有所回落,但其在海外市场的先发优势和语音技术壁垒依然显著。
这种C端产品的成功,为MiniMax的B端API出海奠定了独特优势:
差异化定位:与其他厂商主攻文本大模型不同,MiniMax的API出海主打语音交互和多模态理解,避开了与Kimi、GLM的直接竞争。其语音API的价格仅为ElevenLabs的1/5,已在海外游戏、社交、教育应用中快速渗透。
关键数据:据OpenRouter平台数据,MiniMax M2.5周调用量高达1.75万亿Token,五连冠全球第一,超过Kimi K2.5、GLM-5与DeepSeek V3.2三家总和。其语音Token占比超过60%的差异化产品组合,使其在海外市场找到了独特生态位。
重要说明:以下数据主要基于全球头部AI模型API聚合平台OpenRouter的公开统计,以及企业官方披露信息。OpenRouter平台汇集了全球开发者的API调用数据,是观察大模型调用趋势的重要窗口。
| 厂商 | 周调用量(OpenRouter,万亿Token) | 排名 | 数据来源 |
|---|---|---|---|
| MiniMax(M2.5) | 1.75 | 🥇 全球第1 | OpenRouter,2026-03-16 |
| 阶跃星辰(Step 3.5 Flash) | 1.34 | 🥈 全球第2 | OpenRouter,2026-03-16 |
| DeepSeek(V3.2) | 1.04 | 🥉 全球第3 | OpenRouter,2026-03-16 |
| 月之暗面(Kimi K2.5) | 0.9-1.21 | 全球前3 | OpenRouter,2026-02至03月 |
| 智谱AI(GLM-5) | 0.78+ | 全球前5 | OpenRouter,2026-02-24 |
注:零一万物、百川智能等厂商主要发力企业级私有部署和端侧AI,OpenRouter平台数据无法完全反映其实际调用量。
关键统计数据(2026年3月):
数据说明:
- OpenRouter数据仅代表该平台(全球主要API聚合平台之一)的调用情况,非全量数据
- 实际各厂商总调用量(含自有平台、企业私有化部署)远高于OpenRouter数据
- 海外占比数据因企业披露有限,文中为行业估算值,仅供参考
- 1万亿Token = 1,000,000,000,000 Token(10^12)
(1)调用量已领先,海外占比持续提升
据OpenRouter平台数据,中国大模型周调用量已连续一个月超越美国(9.82万亿 vs 2.99万亿Token)。全国日均Token调用量已突破140万亿Token(工信部数据)。随着Cloudflare等国际平台陆续接入国产模型,海外占比有望从当前的个位数提升至20%以上。
(2)DeepSeek的"鲶鱼效应"
DeepSeek V3.2在OpenRouter平台周调用量超过1万亿Token,稳居全球前三。其开源策略和极致性价比正在重塑全球开发者的大模型选择——当开发者发现可以以1/24的成本获得接近GPT-5的性能时,迁移便不可避免。DeepSeek的存在,正在迫使其他厂商加速出海进程。
(3)北美是主战场,平台接入是关键
从地域分布来看,北美市场(美国+加拿大)是国产大模型出海的主战场。以Cloudflare Workers AI为例,其全球边缘计算节点覆盖超过330个城市,接入Kimi K2.5意味着国产模型已触达全球最具影响力的开发者群体。平台接入(如Cloudflare、AWS、Azure)正成为国产模型出海的关键路径。
国产大模型能够实现"Token出海",最根本的原因是推理成本的指数级下降。
以Kimi K2.5为例,其每百万Token的推理成本约为0.5美元(基于公开定价和合理的毛利率估算),而GPT-4 Turbo的同等成本约为10美元。这意味着,即使考虑到网络延迟、跨境合规等额外成本,国产大模型仍然有5-10倍的成本优势。
这一成本优势源于三个层面:
成本优势需要性能支撑。2024年以来,以Kimi、GLM-4、Yi为代表国产大模型在主流评测基准(MMLU、HumanEval、C-Eval等)上的得分已经全面超越了GPT-3.5,并在特定领域(如中文理解、长文本处理)接近或超越GPT-4。
对于企业客户而言,"够用"比"最好"更重要。 在大多数应用场景(客服、文案生成、代码辅助、知识问答)中,国产大模型的能力已经足够满足需求。
吊诡的是,中美科技竞争的加剧,反而为国产大模型出海创造了"意外红利"。
一方面,海外企业开始寻求"多供应商"策略以分散地缘政治风险,国产大模型成为了OpenAI和Anthropic之外的"第三选择"。另一方面,部分国家(如中东、东南亚、拉美)出于数据主权和外交平衡的考虑,对非美国AI服务持更为开放的态度。
Cloudflare选择Kimi,某种程度上也是这一趋势的缩影——作为一家在全球多个国家运营的基础设施公司,它需要向客户展示"供应商多样性"的能力。
欧盟的GDPR(通用数据保护条例)是全球最严格的数据隐私法规。国产大模型要在欧洲市场大规模落地,必须解决数据跨境传输、模型训练数据溯源、用户"被遗忘权"等一系列合规问题。
目前,五小龙中仅有智谱AI和零一万物在欧盟设有数据中心,其他厂商仍依赖新加坡或香港节点服务欧洲客户。这种架构虽然可以绕过部分监管,但在面对严格的企业级合规审计时仍存在风险。
尽管技术能力已经达标,但国产大模型在海外市场仍面临品牌认知的挑战。很多海外开发者对国产模型的印象仍停留在"便宜但不可靠"的阶段。
改变这一认知需要时间和案例积累。Cloudflare与Kimi的合作,是一个重要的转折点——当全球顶级的互联网公司开始公开采用国产模型,其他企业的疑虑将被逐步消解。
美国对华AI芯片出口管制,是悬在国产大模型头顶的达摩克利斯之剑。
虽然目前国产厂商通过囤积A100/H100、采用国产替代芯片(如华为昇腾)、以及算法优化等方式维持了算力供给,但如果未来管制进一步收紧,国产大模型的训练和推理成本优势可能会被削弱。
长期来看,算力自主可控是国产大模型出海的"必修课"。
预计未来一年,国产大模型的API价格将继续下降,海外调用量将保持高速增长。我们可能会看到:
随着API调用规模的扩大,国产大模型厂商将开始构建海外开发者生态:
最终,全球AI基础设施市场将形成"三足鼎立"或"多极格局":
在这一格局中,Token作为一种"数字商品",将像石油、芯片一样成为全球贸易的重要组成部分。而中国,有望成为Token出口的全球第二大供应国。
Cloudflare选择Kimi,是一个信号,更是一个开端。
它标志着国产大模型正在从"成本优势"向"价值认可"跃迁。当全球顶级的科技公司开始将核心业务负载迁移至中国模型,这意味着中国AI产业已经跨越了从"跟跑"到"并跑"的关键节点。
Token出海,不仅是技术的输出,更是中国AI产业自信的体现。在DeepSeek开源模型和五小龙的差异化出海策略推动下,全球AI市场的版图正在被重新绘制。
对于国产大模型厂商而言,出海之路才刚刚开始。前方的道路既有无限机遇,也有重重挑战。但可以确定的是,全球AI的"中国时刻",已经到来。
