首页
产品服务
模型广场
Token工厂
算力市场算力商情行业资讯
注册

2026年AI算力变天:DeepSeek V4全面换装华为,英伟达被踢出局

发布日期:2026-04-08 来源:百家号作者:百家号浏览:3

DeepSeek全面转向华为芯片

  DeepSeek这次玩真的了。不是小打小闹,是把新一代旗舰模型V4,完全换上了华为的芯片。阿里、字节、腾讯直接跟单,一出手就是几十万颗。要知道一年前,DeepSeek那会儿还在用英伟达的H800呢。

封锁倒逼国产替代

  这事儿得从一场封锁说起。2025年初,DeepSeek靠V3和R1模型低成本训练震动全球,美股一天蒸发5890亿美元。但当时它用的硬件,还是英伟达专供中国的H800。结果美国一看不对劲,2025年4月直接补刀,连降级版的H20也给禁了。

  英伟达CEO黄仁勋自己都认了:在中国高端芯片市场的份额,从95%直接归零。那怎么办?不用英伟达了呗。路透社和The Information的报道说得挺明白:DeepSeek在V4开发过程中,压根没给英伟达开放早期访问权限。

  这完全反了行业规矩——以前发新版,都是优先跟芯片厂做性能协同优化。这次他们倒好,提前找上了华为和寒武纪。代价呢?延期发布。过去几个月,DeepSeek团队一直在跟华为那边重写底层代码。

昇腾950PR扛大梁

  有位接近团队的工程师透露,最磨人的不是写算子,是精度对齐——同一个模型,在英伟达和昇腾上跑出一样的结果,得反复调。那华为的芯片到底够不够用?这次扛大梁的是昇腾950PR。3月21日刚发布的,Atlas 350加速卡就是它。

  参数摆在这儿:FP8精度算力1PFLOPS,是英伟达H20的2.87倍。128GB自研HBM显存,带宽1.6TB/s。华为那边实测说,互联网推荐场景时延更低,特别适合短视频、电商这些高并发场景。

  但实话实说,昇腾910C的推理吞吐量大约只有H100的60%。这差距怎么办?华为的办法是搞“超节点”——把一堆芯片高速互联堆成集群。深圳刚启用的国内首个万卡昇腾910C集群,总算力1.1万P,故障率千分之零点三,训练线性度93%。这招管不管用,等V4跑起来就知道了。

市场抢购与生态挑战

  市场已经等不及了。为了迎接V4云服务上线,阿里、字节、腾讯直接抢货,订单几十万颗,直接把芯片价格推高了20%。2025年全年,华为昇腾出货81.2万张,占了国产芯片将近一半的份额。华为自己定的目标更狠:2026年昇腾总产量要干到160万片。

  这背后其实是出口管制倒逼出来的。2022年到现在,美国一步步收紧,从A100到H800再到H20,能封的全封了。你不是不卖吗?那我自己搞。DeepSeek现在不光是“用”国产芯片,而是在帮国产芯片“磨”生态——V4一共有三个变体,每个都是为国产芯片量身定做的。

  但说实话,软件生态这块还有硬仗要打。华为的CANN框架虽然一直在补算子库,跟英伟达的CUDA比还有差距。昇腾910C在训练大模型时,稳定性也是老大难。去年DeepSeek用910C训练推理模型,大规模分布式训练动不动就崩。

V4是一场大考

  V4这次能不能跑顺,不只是DeepSeek一家的事。它是国产算力能否撑起顶级模型的一次大考。答案,就在未来几周。

本文转载自百家号, 作者:百家号, 原文标题:《 2026年AI算力变天:DeepSeek V4全面换装华为,英伟达被踢出局 》, 原文链接: https://baijiahao.baidu.com/s?id=1861867984225261093&wfr=spider&for=pc。 本平台仅做分享和推荐,不涉及任何商业用途。文章版权归原作者所有。如涉及作品内容、版权和其它问题,请与我们联系,我们将在第一时间删除内容!
本文相关推荐
暂无相关推荐
点击立即订阅