智算多多



本次DeepSeek-V4系列包含Pro和Flash两个模型版本:
总参数1.6T
总参数284B
无论是V4系列的Pro还是Flash,都将100万超长上下文能力作为基础配置,大幅提升了模型处理长文本的容量。如下图所示,DeepSeek-V4采用了新型的注意力机制,通过架构优化降低了单次推理的算力消耗,百万上下文不再是昂贵的“进阶选项”。
另外,V4还将Agent(智能体)作为重点优化方向,在代码编写和复杂逻辑推理上表现出色。这意味着大模型正在加速从基础的交互工具向具备独立执行能力的生产力工具转化。
V4维持了较低的API接口定价(如下表所示),并在模型发布后连续两日降价,降价后DeepSeek-V4-Pro输入缓存命中的价格已降低至0.025元/百万token,为原价的四十分之一,创下全球大模型价格新低。
| 模型版本 | 输入价格(缓存命中) | 输入价格(缓存未命中) | 输出价格 |
|---|---|---|---|
| DeepSeek-V4-Pro | 0.025元/百万token | 0.10元/百万token | 0.10元/百万token |
| DeepSeek-V4-Flash | 0.01元/百万token | 0.04元/百万token | 0.04元/百万token |
注:缓存命中是指模型直接复用近期已处理过的上下文数据以避免重复计算,而缓存未命中则是指输入全新内容或缓存已失效,需模型消耗算力从头进行完整计算。
官方还明确表示,预计今年下半年,随着国产昇腾950超节点批量上市与部署,Pro的价格还将出现大幅下调。
这表明国产底层算力的规模化应用,正在拉低大模型的使用门槛,为AI应用的大范围普及创造了条件。
DeepSeek-V4不仅继续兼容英伟达生态,还首次在底层原生适配并打通了华为昇腾等国产芯片体系。在其官方技术报告中,国产芯片历史上首次与英伟达GPU并列进入硬件验证基准清单。
并且,在DeepSeek-V4发布当日,华为昇腾、寒武纪、海光等8家国产AI芯片品牌明确宣布已完成适配,并在国产硬件上实现了较好的推理加速。
在高端芯片获取受限的背景下,利用国产算力进行顶级大模型的推理,不仅打破了硬件垄断,更进一步提振了中国本土AI产业链落地信心与商业预期.
DeepSeek-V4将“百万上下文”作为了标配,这意味着单次用户请求所处理的数据量大幅增加,再叠加较为低廉可得的价格,可能会促使Token消耗量爆发。而在这背后,无论是应对海量推理需求,还是后续各家大模型的跟随训练,都需要智算中心、服务器和高速网络设备作为底层支撑。
相关指数示例
DeepSeek-V4本次与昇腾、寒武纪等8家国产AI芯片完成深度适配,并给出了“下半年昇腾950超节点批量上市”的明确预期。大模型对国产算力的海量需求,或将倒逼国内芯片设计、晶圆代工、封装测试以及半导体设备等全产业链加速成熟。
相关指数示例
DeepSeek-V4的另一大技术亮点是Agent能力的显著提升,并已针对主流Agent产品进行适配,因此能以更低成本支撑起更加复杂的自动执行的任务。Agent能力的提升和成本的下降,有利于拓宽软件应用层的商业化落地场景,促使办公软件和企业管理系统加速完成智能化改造。
相关指数示例
此外,如果想一键布局AI产业链的各个环节,也可以关注中证人工智能主题指数——成份行业既包括上游算力相关的半导体、通信设备,也包含中游大模型,以及下游应用相关的软件、游戏等场景。
DeepSeek-V4的发布,不仅印证了国内大模型技术的演进,也有望促进国产算力产业链的加速发展。通过配置相关指数,投资者可以较为便捷地参与到这场长期的科技产业变革中。
但需要特别注意的是,科技产业的发展并非线性,从大模型适配到最终相关企业盈利,需要一定的传导时间,而资本市场的预期有时会领先于企业的实际业绩兑现。此外,科技类指数普遍具有高波动的特征,要注意避免在市场情绪过热时孤注一掷、盲目追高。