首页
产品服务
模型广场
Token工厂
算力市场算力商情行业资讯

东吴证券:DeepSeek V4是大模型全流程国产算力训练重要里程碑

发布日期:2026-05-06 来源:智通财经/搜狐作者:智通财经/搜狐

DeepSeek V4首次由华为昇腾芯片参与训练

  DeepSeek V4 Flash是首个公开说明训练侧使用国产算力的通用大模型,通过三大核心设计实现了去英伟达化的技术布局。(1)引入MXFP4量化感知训练,对MoE专家权重与索引器QK路径实现FP4量化,降低了对NVIDIA FP8生态的绑定,可无缝适配华为昇腾、寒武纪等国产芯片;(2)采用TileLang领域专用语言开发底层算子,脱离CUDA生态强绑定,可跨硬件平台编译,降低向国产芯片的迁移成本;(3)自研MegaMoE2融合内核,实现专家并行的细粒度通信计算重叠,已在华为昇腾平台完成适配跑通,解决了国产硬件环境下MoE模型的通信瓶颈。

性能表现:整体跻身全球第一梯队,多项核心指标比肩甚至超越国际顶级闭源模型

  无论DeepSeek V4表现如何,战略意义均十分重要,对国产算力的训练适配前景才是关注的重点。

本文转载自智通财经/搜狐, 作者:智通财经/搜狐, 原文标题:《 东吴证券:DeepSeek V4是大模型全流程国产算力训练重要里程碑 》, 原文链接: https://m.sohu.com/a/1016766563_114984/。 本平台仅做分享和推荐,不涉及任何商业用途。文章版权归原作者所有。如涉及作品内容、版权和其它问题,请与我们联系,我们将在第一时间删除内容!
本文相关推荐
暂无相关推荐