当前位置: 首页 > 行业资讯 > 资讯详情

智造观察 | Token(词元)出海,国产大模型杀入美国B端市场

发布日期：2026-04-01 来源：新浪网作者：新浪网

Cloudflare的"投名状"：为什么选Kimi？

　　让我们先算一笔账。

　　Cloudflare Workers AI平台每天处理的推理请求数以百亿计。以GPT-4级别的模型为例，每百万Token的输入成本约为30美元，输出成本约为60美元。而Kimi K2.5的定价策略极具侵略性——输入价格仅为每百万Token 3美元，输出价格为每百万Token 12美元。

　　简单的数学：同等性能下，Kimi的成本仅为闭源竞品的20%-30%。

　　对于Cloudflare这样的基础设施巨头而言，这意味着每年数亿美元的直接成本节约。Matthew Prince在SXSW演讲中没有掩饰这一选择的商业逻辑："企业客户不关心模型是谁训练的，他们只关心三件事——响应速度、准确率和账单金额。"

技术层面的"临门一脚"

　　成本只是表面，性能才是内核。

　　Kimi K2.5之所以能够通过Cloudflare的严格技术评估，关键在于其在长文本处理（Long Context）领域的突破。该模型支持高达256,000 Token的上下文窗口，在特定测试场景下更可扩展至200万汉字——这意味着它可以一次性处理整本长篇小说、完整代码库或数小时的视频会议记录。

　　对于Cloudflare的B端客户（主要是SaaS公司和开发者）而言，这一能力直接转化为产品竞争力。想象一下：一个法律Tech产品可以一次性分析数百页的合同文本；一个代码助手可以理解整个项目的架构而非单个文件；一个客服机器人可以记住用户过去一年的所有交互记录。

　　Kimi在长文本领域的技术壁垒，成为了打破欧美客户"品牌偏见"的利器。

Token出海的战略地图：四小龙的差异化路径

　　如果将大模型出海比作一场战役，那么DeepSeek打响的是"开源革命"的枪声，而五小龙正在打的是一场更为精细的"API渗透战"。

月之暗面：长文本+C端口碑的"双轮驱动"

　　出海路径：To C产品建立品牌认知 → To B API实现商业变现

　　月之暗面的策略可以概括为"农村包围城市"。在国内市场，Kimi智能助手已经积累了超过2000万月活用户，其"支持200万字长文本"的卖点深入人心。这种C端品牌势能，为其B端API出海提供了天然的信任背书。

　　在海外市场，月之暗面采取了"农村包围城市"的策略：

第一阶段：通过开发者社区（GitHub、Hacker News、Reddit）建立技术口碑
第二阶段：与Cloudflare、AWS等云平台合作，进入企业采购名单
第三阶段：直接服务海外SaaS公司，成为其AI能力的基础设施

　　关键数据：据OpenRouter平台数据，Kimi K2.5周调用量稳居全球前五；在Cloudflare上架后，海外开发者调用量持续增长，北美和欧洲市场贡献超过60%。

智谱AI：清华系的技术正统与开源生态

　　出海路径：开源模型建立生态 → 企业级服务收割价值

　　智谱AI的出海策略与其技术基因一脉相承——稳扎稳打，重视生态。

　　2024年，智谱先后开源了ChatGLM3-6B和GLM-4系列模型，在Hugging Face上的累计下载量超过3000万次。这一开源策略为其赢得了全球开发者社区的广泛认可。据智谱官方披露，其企业级API服务已覆盖超过50个国家和地区，海外收入占比从2024年初的5%提升至2026年初的35%。

　　智谱的核心优势在于其"全栈自研"的技术实力。从底层算子优化到上层应用框架，智谱拥有完整的自主知识产权。这在当前地缘政治日趋复杂的背景下，成为了其服务海外敏感行业客户（如金融、政务）的重要筹码。

零一万物：李开复的国际化视野与硬件协同

　　出海路径：海外市场优先 → 边缘计算+端侧AI

　　作为四小龙中国际化基因最浓的团队，零一万物从成立之初就将出海作为核心战略。创始人李开复的全球人脉和视野，使其在海外市场拓展上拥有天然优势。

　　零一万物的差异化竞争点在于端侧AI。其推出的Yi系列模型在量化压缩后，可以在消费级GPU甚至高端CPU上流畅运行。这一特性使其在边缘计算、IoT设备和私有化部署场景中具有独特竞争力。

　　据OpenRouter平台早期数据（2026年3月），零一万物Yi-34B Chat占据平台约2.9%的市场份额，在中小开发者中性价比优势突出。其端侧推理场景占比较高，是五小龙中仅次于MiniMax的端侧AI代表。

百川智能：垂直行业的深度渗透

　　出海路径：垂直场景切入 → 行业Know-how构建护城河

　　与前三者不同，百川智能选择了"垂直深耕"的出海路径。其重点发力的领域包括医疗、法律和金融——这些场景对模型的专业性和准确性要求极高，但客单价也相应更高。

　　百川的出海策略是"以点带面"：先在新加坡、香港等华语文化圈地区建立标杆案例，再逐步渗透至欧美主流市场。其医疗大模型Baichuan-Med已通过新加坡HSA（卫生科学局）的初步审核，有望成为首个在海外获得医疗AI资质的国产大模型。

MiniMax：语音与多模态的"出海先锋"

　　出海路径：To C应用出海 → 语音技术领先 → API生态构建

　　MiniMax（稀宇科技）是五小龙中国际化程度最高的一员。其推出的AI角色扮演应用Talkie（海外版星野）曾登顶全球AI伴侣类产品免费榜，2024年8月海外单月下载量曾达235万。虽然2025年四季度数据显示其月活有所回落，但其在海外市场的先发优势和语音技术壁垒依然显著。

　　这种C端产品的成功，为MiniMax的B端API出海奠定了独特优势：

语音技术壁垒：Talkie的核心竞争力在于超逼真的语音合成和情感表达，这一技术已通过API开放给海外开发者
多模态能力：MiniMax是国内最早实现"文本+语音+视觉"统一建模的大模型厂商之一
海外合规经验：通过Talkie的运营，MiniMax已积累了丰富的海外数据合规和用户运营经验

　　差异化定位：与其他厂商主攻文本大模型不同，MiniMax的API出海主打语音交互和多模态理解，避开了与Kimi、GLM的直接竞争。其语音API的价格仅为ElevenLabs的1/5，已在海外游戏、社交、教育应用中快速渗透。

　　关键数据：据OpenRouter平台数据，MiniMax M2.5周调用量高达1.75万亿Token，五连冠全球第一，超过Kimi K2.5、GLM-5与DeepSeek V3.2三家总和。其语音Token占比超过60%的差异化产品组合，使其在海外市场找到了独特生态位。

数据透视：Token出海的规模与增速

国产大模型Token调用量全景

　　重要说明：以下数据主要基于全球头部AI模型API聚合平台OpenRouter的公开统计，以及企业官方披露信息。OpenRouter平台汇集了全球开发者的API调用数据，是观察大模型调用趋势的重要窗口。

厂商	周调用量（OpenRouter，万亿Token）	排名	数据来源
MiniMax（M2.5）	1.75	🥇 全球第1	OpenRouter，2026-03-16
阶跃星辰（Step 3.5 Flash）	1.34	🥈 全球第2	OpenRouter，2026-03-16
DeepSeek（V3.2）	1.04	🥉 全球第3	OpenRouter，2026-03-16
月之暗面（Kimi K2.5）	0.9-1.21	全球前3	OpenRouter，2026-02至03月
智谱AI（GLM-5）	0.78+	全球前5	OpenRouter，2026-02-24

　　注：零一万物、百川智能等厂商主要发力企业级私有部署和端侧AI，OpenRouter平台数据无法完全反映其实际调用量。

　　关键统计数据（2026年3月）：

中国大模型周调用总量：9.82万亿Token（OpenRouter平台）
美国大模型周调用总量：2.99万亿Token（OpenRouter平台）
中国占比：约77%（OpenRouter平台头部模型）
全国日均Token调用量：140万亿Token（工信部数据）

数据说明：

OpenRouter数据仅代表该平台（全球主要API聚合平台之一）的调用情况，非全量数据

实际各厂商总调用量（含自有平台、企业私有化部署）远高于OpenRouter数据

海外占比数据因企业披露有限，文中为行业估算值，仅供参考

1万亿Token = 1,000,000,000,000 Token（10^12）

关键洞察

　　（1）调用量已领先，海外占比持续提升

　　据OpenRouter平台数据，中国大模型周调用量已连续一个月超越美国（9.82万亿 vs 2.99万亿Token）。全国日均Token调用量已突破140万亿Token（工信部数据）。随着Cloudflare等国际平台陆续接入国产模型，海外占比有望从当前的个位数提升至20%以上。

　　（2）DeepSeek的"鲶鱼效应"

　　DeepSeek V3.2在OpenRouter平台周调用量超过1万亿Token，稳居全球前三。其开源策略和极致性价比正在重塑全球开发者的大模型选择——当开发者发现可以以1/24的成本获得接近GPT-5的性能时，迁移便不可避免。DeepSeek的存在，正在迫使其他厂商加速出海进程。

　　（3）北美是主战场，平台接入是关键

　　从地域分布来看，北美市场（美国+加拿大）是国产大模型出海的主战场。以Cloudflare Workers AI为例，其全球边缘计算节点覆盖超过330个城市，接入Kimi K2.5意味着国产模型已触达全球最具影响力的开发者群体。平台接入（如Cloudflare、AWS、Azure）正成为国产模型出海的关键路径。

深层逻辑：为什么是现在？

成本结构的质变

　　国产大模型能够实现"Token出海"，最根本的原因是推理成本的指数级下降。

　　以Kimi K2.5为例，其每百万Token的推理成本约为0.5美元（基于公开定价和合理的毛利率估算），而GPT-4 Turbo的同等成本约为10美元。这意味着，即使考虑到网络延迟、跨境合规等额外成本，国产大模型仍然有5-10倍的成本优势。

　　这一成本优势源于三个层面：

算力成本：国内GPU采购和运维成本低于美国（尽管受限于芯片禁令，但可通过架构优化和集群调度弥补）
工程优化：国产团队在模型量化、投机采样、PagedAttention等推理优化技术上处于全球第一梯队
商业模式：国内厂商普遍采取"薄利多销"策略，愿意以低毛利换取市场份额

模型能力的"及格线"跨越

　　成本优势需要性能支撑。2024年以来，以Kimi、GLM-4、Yi为代表国产大模型在主流评测基准（MMLU、HumanEval、C-Eval等）上的得分已经全面超越了GPT-3.5，并在特定领域（如中文理解、长文本处理）接近或超越GPT-4。

　　对于企业客户而言，"够用"比"最好"更重要。在大多数应用场景（客服、文案生成、代码辅助、知识问答）中，国产大模型的能力已经足够满足需求。

地缘政治的"意外红利"

　　吊诡的是，中美科技竞争的加剧，反而为国产大模型出海创造了"意外红利"。

　　一方面，海外企业开始寻求"多供应商"策略以分散地缘政治风险，国产大模型成为了OpenAI和Anthropic之外的"第三选择"。另一方面，部分国家（如中东、东南亚、拉美）出于数据主权和外交平衡的考虑，对非美国AI服务持更为开放的态度。

　　Cloudflare选择Kimi，某种程度上也是这一趋势的缩影——作为一家在全球多个国家运营的基础设施公司，它需要向客户展示"供应商多样性"的能力。

挑战与隐忧：Token出海的"三重门"

合规门槛：GDPR与数据主权的博弈

　　欧盟的GDPR（通用数据保护条例）是全球最严格的数据隐私法规。国产大模型要在欧洲市场大规模落地，必须解决数据跨境传输、模型训练数据溯源、用户"被遗忘权"等一系列合规问题。

　　目前，五小龙中仅有智谱AI和零一万物在欧盟设有数据中心，其他厂商仍依赖新加坡或香港节点服务欧洲客户。这种架构虽然可以绕过部分监管，但在面对严格的企业级合规审计时仍存在风险。

品牌认知：从"便宜货"到"可信赖"

　　尽管技术能力已经达标，但国产大模型在海外市场仍面临品牌认知的挑战。很多海外开发者对国产模型的印象仍停留在"便宜但不可靠"的阶段。

　　改变这一认知需要时间和案例积累。Cloudflare与Kimi的合作，是一个重要的转折点——当全球顶级的互联网公司开始公开采用国产模型，其他企业的疑虑将被逐步消解。

算力天花板：芯片禁令的达摩克利斯之剑

　　美国对华AI芯片出口管制，是悬在国产大模型头顶的达摩克利斯之剑。

　　虽然目前国产厂商通过囤积A100/H100、采用国产替代芯片（如华为昇腾）、以及算法优化等方式维持了算力供给，但如果未来管制进一步收紧，国产大模型的训练和推理成本优势可能会被削弱。

　　长期来看，算力自主可控是国产大模型出海的"必修课"。

未来展望：Token出海的"终局"想象

短期（6-12个月）：API调用的"军备竞赛"

　　预计未来一年，国产大模型的API价格将继续下降，海外调用量将保持高速增长。我们可能会看到：

更多国际云厂商（如AWS、Azure、Google Cloud）将国产大模型纳入官方模型市场
国产模型在OpenRouter等平台的周调用量突破15万亿Token
出现专门针对国产大模型的海外聚合平台（类似于国内的SiliconFlow）
国产模型在海外企业级市场的渗透率突破30%

中期（1-3年）：从API到"生态"

　　随着API调用规模的扩大，国产大模型厂商将开始构建海外开发者生态：

推出海外版的"大模型应用商店"
设立海外AI创业基金，投资基于国产模型的SaaS公司
与海外高校合作，建立联合实验室，培养下一代AI人才

长期（3-5年）：全球化AI基础设施的"多极格局"

　　最终，全球AI基础设施市场将形成"三足鼎立"或"多极格局"：

美国阵营：OpenAI、Anthropic、Google、Meta等，主导北美和西欧市场
中国阵营：四小龙、DeepSeek等，主导东南亚、中东、拉美和部分欧洲市场
区域玩家：如欧洲的Mistral、日本的Sakana、中东的Falcon等，在本土市场占据一定份额

　　在这一格局中，Token作为一种"数字商品"，将像石油、芯片一样成为全球贸易的重要组成部分。而中国，有望成为Token出口的全球第二大供应国。

结语

　　Cloudflare选择Kimi，是一个信号，更是一个开端。

　　它标志着国产大模型正在从"成本优势"向"价值认可"跃迁。当全球顶级的科技公司开始将核心业务负载迁移至中国模型，这意味着中国AI产业已经跨越了从"跟跑"到"并跑"的关键节点。

　　Token出海，不仅是技术的输出，更是中国AI产业自信的体现。在DeepSeek开源模型和五小龙的差异化出海策略推动下，全球AI市场的版图正在被重新绘制。

　　对于国产大模型厂商而言，出海之路才刚刚开始。前方的道路既有无限机遇，也有重重挑战。但可以确定的是，全球AI的"中国时刻"，已经到来。

本文转载自新浪网，作者：新浪网，原文标题：《智造观察 | Token(词元)出海,国产大模型杀入美国B端市场》，原文链接： http://finance.sina.com.cn/wm/2026-04-01/doc-inhsyfuw2695640.shtml。本平台仅做分享和推荐，不涉及任何商业用途。文章版权归原作者所有。如涉及作品内容、版权和其它问题，请与我们联系，我们将在第一时间删除内容！

本文相关推荐

暂无相关推荐

点击立即订阅

智算多多

联系我们

官方邮箱：service@zsdodo.com

公司地址：北京市丰台区南四环西路188号总部基地三区国联股份数字经济总部

关注我们

公众号

视频号