智算多多



你听说了吗?现在最硬的通货,可能不是黄金,也不是比特币,而是“算力”。就在最近,英伟达最先进的Blackwell系列芯片,租一小时的价格已经涨到了4.08美元,短短两个月就飙升了48%。这还不是最关键的,东吴证券一份研报直接点破:算力租赁公司正在从“卖算力”的房东,悄悄变成“卖Token”的合伙人,这意味着它们的赚钱方式和估值逻辑可能要彻底变天了。今天,我们就来聊聊这场正在发生的、静悄悄的财富大转移。
如果你是一家AI创业公司的老板,现在最头疼的恐怕不是招不到算法大神,而是租不到、也租不起训练模型的GPU卡。纽约的数据提供商Ornn指出,近几个月,英伟达全系列GPU在云数据中心的现货租金都在大幅上涨。这种紧缺是全球性的,亚马逊云科技(AWS)在2026年1月,二十年来首次上调了面向大模型训练的机器学习容量块价格,涨幅约15%。紧接着,谷歌也宣布将在5月1日上调数据传输费用。
巨头的调价像推倒了第一块多米诺骨牌。国内云厂商迅速跟进,2026年4月,阿里云宣布对AI算力和相关存储产品提价5%到34%。算一笔账就明白压力有多大:如果按企业日均训练8小时计算,AWS涨价后,月成本直接增加1200美元,一年下来就是近44万美元。对于财大气粗的巨头或许还能承受,但对无数中小企业而言,这直接催化它们转向第三方算力租赁市场。
为什么突然这么“缺算力”?核心驱动力来自一个你可能听过但不太熟悉的名词:Token。AI应用已经从早期的“训练时代”狂奔进入“推理时代”。这意味着,像ChatGPT这样的模型,每回答你一个问题,都要消耗大量的Token进行实时计算。摩根大通预测,中国的推理算力Token消费量将从2025年的10千万亿增长到2030年的3900千万亿,增幅高达369倍。更直观的数据是,元旦至今的三个月内,仅国内AI推理任务的Token调用量就暴增了250%。
全球AI大模型聚合平台OpenRouter的数据显示,在2026年3月30日至4月5日这一周,全球AI大模型词元总调用量达到了27万亿,环比增长18.9%。而且,中国AI大模型的词元调用量已经连续5周超过美国。需求的爆炸式增长,像海啸一样拍向算力供给的堤坝。然而,供给端却面临着多重约束,高端GPU,尤其是英伟达的H100、H200、B200等芯片,受限于产能和供应链因素,持续处于偏紧状态。
企业自建算力中心也不是一条轻松的路,它存在建设周期长、资本开支巨大、技术门槛高等问题。正是在这种严重的供需错配下,能够快速交付、规模化部署、成本相对可控的算力租赁,成为了衔接产业爆发与供给瓶颈的核心解决方案。它的商业模式确定性和业绩弹性变得异常显著。当前,算力租赁市场的潜在收入规模在2026年有望达到2600亿元,年增速超过20%。
市场很热,但水也很深。行业正从早期的“野蛮生长”迈入“精耕细作”的洗牌期。那些仅拥有几百张芯片、缺乏核心资源与技术的“倒爷式”企业,正在加速被淘汰出局。真正能站稳脚跟的玩家轮廓已经清晰。
第一类是“资源派”,比如能通过海外渠道稳定获取英伟达芯片的公司,或者像铜牛信息那样,作为京津冀智算中心联合投资方,凭借地方补贴将机柜成本压到行业低位的企业。

第二类是“服务派”。单纯租赁硬件的毛利在走低,而能提供模型迁移、智能调度等增值服务的企业,议价权开始凸显。例如,有的服务商通过智能调度系统,可以将客户算力集群的利用率从40%提升至75%,帮企业一年节省上千万元成本。
第三类是“生态派”,比如深度绑定华为昇腾生态的厂商,可以借助各地算力券政策对国产芯片的倾斜,中标多个智算中心项目,增长确定性很强。
行业的胜负手,已经不止于谁手里有更多高端显卡。东吴证券的研报揭示了一个更深刻的趋势:算力租赁厂商的业务模式,正从单纯的裸算力出租,升级为模型服务或Token分成模式。简单说,就是从“卖算力”转向“卖Token”。这是一种根本性的商业范式转化。传统的模式是按GPU使用时长或整机租赁来收费,而新的模式,是客户根据实际消耗的Token数量来付费。
雪球上一位用户的观察很直接:算力采购模式在今年开始发生转变,更倾向于按Token消耗量结算。这种按量付费的方式,可以避免算力使用不饱和时产生闲置成本,对客户更友好。
但更深层的意义在于,掌握极强议价权的算力租赁公司,未来极有可能介入大厂的Token分成体系。想象一下,大厂每卖出一份Token套餐,就需要将部分收益分给提供底层算力的租赁方,这就像从收房租变成了参与店铺的营业额分成。
这种转变一旦普及,将大幅提升算力租赁公司的盈利能力,并推动其估值体系从传统的市盈率(PE)向更注重成长性的市销率(PS)切换。市场已经在用真金白银投票。作为国内第三方训练算力的重要参与者,协创数据预计其2026年第一季度净利润同比预增284%到402%。公司表示,这得益于紧抓人工智能与智能算力业务机遇,算力项目的交付带动了营收大幅增长。
协创数据的例子并非孤例。根据产业跟踪,该公司在算力基建集群领域的累计投资未来三年可达千亿级别以上,在稳态下有望贡献150亿到200亿的年化利润。算力租赁被看作是AI产业红利下,业绩兑现路径最清晰、盈利弹性最大的核心环节之一。行业的景气度也反映在资本开支上,2025年协创数据累计投入超200亿,仅第一季度投入就超过100亿。
除了这些头部玩家,整个算力服务生态也在多元化发展。凌雄科技构建了“回收+再制造+租赁”的闭环运营模式,通过回收GPU、服务器等设备,再将其转化为可租赁的资源,旨在为中小企业提供高性价比的算力设备租赁服务。工业和信息化部也印发了通知,鼓励设立中小企业专属算力池,并探索“算力银行”、“算力超市”等创新业务。
政策在推动,市场在膨胀,但挑战也同样具体。高端算力芯片的获取难度与成本构成了刚性约束。尽管国产芯片替代进程在加速,寒武纪、摩尔线程等企业营收呈现三位数增长,但在高端GPU领域,供给缺口依然显著。这种“芯片荒”直接传导至算力租赁市场,推动价格持续上涨,形成了典型的卖方市场格局。业内人士判断,算力租赁行业的高景气度至少可持续至2027年。
在此期间,行业内头部企业凭借资源把控和技术优势掌握着话语权,而强劲的供需缺口将持续带动价格中枢震荡上行。传统算力租赁的垫资模式也给企业带来现金流压力,一份3到5年的长周期租约,意味着企业需要提前投入巨额资本购置硬件,但租金回收却需要数年时间慢慢摊薄。这极度考验企业的融资能力和资金周转效率。
当前,算力公司向腾讯等头部互联网大厂交付算力卡,起步门槛已经提高到了万卡集群,而且租约一签就是五年起步。这锁定的是长期需求,也锁定了未来的现金流。对于租赁公司而言,它们还拥有一个独特的“安全垫”:算力服务器的残值很高。像A100、H100这样的服务器,在使用2到3年后,二手价格仍可达到新品的60%到80%,这有效优化了租赁期后期的现金回收结构。
更关键的是资金杠杆。当前国内针对算力行业的融资成本优惠政策力度很大,头部租赁商的融资成本已经可以降到3%到4%,而且配资比例可以达到1:9。在算力租金持续上涨的周期中,这种低息高杠杆能显著放大企业的净资产收益率(ROE)弹性。所以,这个行业的游戏,正在变成资源、技术、资金和运营效率的综合比拼。
就在我们讨论地面算力争夺战的同时,一个更具科幻感的赛道已经萌芽——太空算力。2025年5月,我国发射了12颗三体计算卫星完成组网,这是全球首个太空算力星座,由之江实验室主导。它的规划是组网2800颗算力星座,未来与地面百个算力中心互联,构建天地一体化算力网络。无独有偶,SpaceX也在2026年1月向美国联邦通信委员会提交了轨道数据中心卫星系统的建设申请,规划由最多100万颗卫星组成空间算力集群。
太空算力的核心优势,在于试图解决地面算力中心面临的能源消耗、散热成本高以及地理覆盖有限的问题。它通过卫星组网实现全球无缝覆盖,目标是利用近地轨道的太阳能和辐射散热机制来承载计算任务。尽管这听起来还很遥远,但工信部在2026年北京经开区举办的太空算力产业大会上已明确指出,太空算力具备战略价值和产业前景。北京经开区还发布了技术攻关榜单,围绕可回收火箭、太空光伏等核心环节鼓励突破,并给予最高1000万元的项目奖励。
视线拉回当下,A股市场中算力租赁板块的波动也加强了。2026年2月,该板块成为领涨核心之一,并带动了电力方向活跃。当月,中国AI模型的周调用量首次超过了美国模型,并且在全球调用量排名前五的模型中占据了四席。市场分析认为,国产AI大模型调用量的提升及变现能力预期的增强,可能会加快其数据调用量的增长和模型性能提升,从而使国产算力产业链受益。
从全球视野看,根据市场研究机构IDC的预测,2026年全球算力租赁市场规模将突破800亿美元,年复合增长率超过25%。这是一个正在快速膨胀的蛋糕。但蛋糕怎么分,规则正在改写。不再是简单地比谁囤的卡多,而是要比谁能更稳定地拿到卡,谁能把算力调度得更高效,谁能提供更深度的服务,以及,谁能在新的Token分成商业模式中,占据更有利的生态位。