智算多多
官方邮箱:service@zsdodo.com

公司地址:北京市丰台区南四环西路188号总部基地三区国联股份数字经济总部


2026年3月27日,全球存储产业年度盛会CFMS MemoryS 2026在深圳举办。作为行业风向标级峰会,本届活动以“穿越周期,释放价值”为核心主题,深度聚焦技术创新与产业链协同升级,吸引了三星电子、慧荣科技、铠侠、Solidigm、英特尔、腾讯云等数十家全球头部企业参与,覆盖存储芯片原厂、主控设计、模组制造、云端服务等全产业链环节。峰会通过高端论坛与技术展览双轨并行,演进中涉及景气趋势展望,聚焦Agent AI时代token/KV Cache剧增下的存力需求爆发,对PCIe 5.0/6.0 SSD、超大容量QLC技术突破及其他AI驱动下的存储创新变革展开前沿探讨,同步展示超百项创新产品。
需求端:据CFM中国闪存市场数据,2026年服务器出货同比+15%,AI服务器在整体服务器出货中占比将突破20%,大模型从训练阶段步入推理阶段,Agent应用爆发导致Token消耗剧增,当序列长度从1k提升至128k token时,KV Cache占用从0.5GB提升至64GB(BF/FP16, 单请求)长上下文+高并发之下,存储需求随token/并发量线性暴涨,CFM预测HBM容量2025/2026年分别同比+90%/35%以上,同时KV Cache下沉叠加HDD供给短缺需求外溢驱动eSSD成为2026年NAND最大下游(占比提升至37%)。
供给端:扩产周期错位,缺货涨价将长期持续。存储原厂普遍采取稳住价格的策略,将先进产能优先投入高毛利的AI存储产品,据CFM,包含HBM/DDR5/LP5X/6较为高端的DRAM产能占比由2024年不到50%提升至2026年的85%+,成熟制程与消费级产能被持续挤压,行业库存由2023年10~12周,2024年8~10周,2026年下降至4周,跌至历史安全线以下。存储扩产周期长达18~24个月,26H2不可能出现供给拐点,慧荣科技认为2027年才是存储缺货的“至暗时刻”。25H2起存储价格迎来史诗级上涨,CFM预计DRAM和NAND ASP将在2026全年保持上涨。AI推理时代存力为核心,存储迎来长周期范式转移,为超级成长,非周期反弹。
在近期的GTC大会上,英伟达着重提出了“Token工厂经济学”,其核心意义在于强化了存储在AI基础设施中的战略地位,也意味着存储产业的盈利天花板将被长期打开,据CFM数据,eSSD产品ASP在26Q1已达消费级NAND ASP 2倍以上。对于存储原厂而言,核心在于进行介质升级及系统架构级重构,本次论坛演讲主要聚焦企业级市场;对于存储解决方案厂商而言,行业焦点从“看谁更便宜”转向“看谁能拿到货”,同时群联电子等头部厂商正加速向自研主控赋能的“客制化高附加值模组”转型,并拓展企业级SSD,以重新定义存储价值,摆脱传统依赖低成本库存的模式。
AI正加速从“训练”走向“推理”阶段,未来推理与训练服务器的比例预计将高达10:1至50:1。目前,受制于存储带宽瓶颈,GPU集群的可用度(利用率)仅约46%至50%。显存升级为核心需求,同时本次峰会多家厂商分享存算协同的功能再分配,eSSD的角色正从“被动的数据容器”跃升为核心的“算力引擎”与“扩展内存层”:在训练侧,依托超大容量QLC eSSD存储Checkpoint,可大幅提升GPU的运行效率;在推理侧,eSSD则通过分层缓存KV Cache,承接庞大上下文状态管理、向量数据库查询及模型分片加载等任务。实测数据显示,将KV缓存卸载至SSD,通过消除预填充计算,可将首token生成时间(TTFT)降低41倍。企业级存储正呈现以下技术趋势:
端侧环境对硬件BOM成本、系统功耗和DRAM内存占用极为苛刻,因此,通过“存算融合”、软硬件智能调度及高级缓存技术,将推理压力从内存(DRAM)向闪存(NAND)转移,成为当前突破端侧大模型部署瓶颈的重要补充。
