智算多多



这里需要说明一下,达到一定规模后,超算和智算的边界是比较模糊的,CPU+GPU异构计算同时满足超算和智算场景。
说明:
(1)HBM,High Bandwidth Memory,高带宽存储器,采用垂直堆叠半导体生产工艺,主要特点是带宽高,功耗低,体积小。像H100用的HBM3,带宽819GB/s,单颗芯片最大24G。
(2)超算和智算在存储层级上还是有一些交叉的,由于需求量太大,肯定采用分布式,只是侧重点不同,例如智算(如大模型训练)更多依赖GPU的显存。
说明:
(1)IT设备的价格及成本是大多数或普遍情况,不涵盖所有方案。
(2)总成本除了IT设备外,还包括整个项目的用地、水、电、设计、施工、人工等成本,以及数据中心配套的如监控、消防、布线、制冷、强弱电等基础设施,每个项目的成本都不相同,上表中的数值仅具备参考作用。
通算,适应性广泛,兼容性好,更贴近大多数的场景;超算,主要服务于国家前沿科学与高精尖领域;智算,赶上人工智能的大潮,带动大批新兴产业。这三者,缺一不可,谁也不能落下。对于我们来说,未来的趋势包括但不限于以下几点:
(1)节能。响应国家双碳政策,提高能效比,实现绿色化转型,这就意味着像液冷这种提高散热上限且降低PUE值的技术未来有很大发展空间。
(2)国产化。这几年我们软硬件行业飞速发展,但仍与国外有着不小差距,因此国产化加速替代一定是重中之重,通过软硬件的技术发展,打破国外生态和技术壁垒,逐步实现自主可控,把核心牢牢攥在自己手中,“有剑在手”永远是最可靠的。
(3)产业化。动不动几百亿的投入数据中心,不是为了好看,不是为了显示“我有”,而是为了带动经济,带动与之相关的硬件、软件、配套一起向前发展,当这些超算中心、智算中心能够通过自动驾驶、生成式AI、金融、医疗、制造、边缘计算等领域不断改善着我们的生活,这种科技才算真正有了价值。
(4)超融合。资源共享,资源互补,三算合一,甚至四算合一(加个量子计算),通过统一调度,最大限度的发挥各自的作用,协同应对各种场景,实现资源利用的最大化。
本文转载自「微信公众号:智算小咖」,原文链接:https://mp.weixin.qq.com/s/HkZiklPd-mVmZGafAZTwkA。转载仅为分享交流,不用于商业用途,版权归原作者及原平台所有。若有侵权,请联系我们,我们将第一时间删除处理。