首页
智算服务
AI 生态大厅
算力商情政策资讯合作与生态场景方案关于我们

面向HPC与AI的多卡GPGPU系统解决方案发布

发布日期:2026-03-31 来源:百家号作者:百家号浏览:1

一体化异构系统架构优势

  在高性能计算与AI加速领域,传统PC+GPU服务器架构常面临两大难题:一方面难以兼顾高采样率数据的实时采集与确定性响应,另一方面在追求大规模算力时系统扩展性受限,功耗和机柜占用高。

  客户在选择AMD Versal™ VM1802 Adaptive SoC时,主要看中其强大的ARM多核处理能力与灵活可编程逻辑,以满足前端高速数据采集和系统控制需求。而芯动力科技提供的多卡GPGPU加速平台,则作为后端可扩展算力解决方案,与VM1802形成一体化异构系统,实现从数据采集到大规模HPC/AI加速的完整链路。

前端数据采集与系统控制

  FPGA模块直接对接多通道模拟ADC,保证采集的时间确定性和即时响应;数据通过高速以太网流入VM1802 Adaptive SoC,由系统统一完成缓存管理、任务分发和多卡调度,避免传统多级主机拷贝带来的延迟与带宽浪费。

多卡GPU协同计算架构

  在多卡GPU协同计算架构中,VM1802 Adaptive SoC运行Linux操作系统,作为系统级调度与控制中枢:由CPU侧统一管理数据流与任务队列,通过DMA机制将数据直接推送至目标GPGPU卡,避免不必要的中间拷贝;同时结合GPU实时负载状态与PCIe拓扑结构,实现跨多卡的动态负载均衡与任务分配,确保算力资源的高效、稳定利用。这一机制是大规模多卡GPU系统实现高吞吐与低时延的关键能力体现。

后端高算力平台特性

  后端计算部分,芯动力科技平台通过PCIe Gen4+Switch拓扑管理最多7张GPGPU卡,每卡约384TOPS INT8,整个平台可实现2600–2800TOPS可扩展算力。系统支持CUDA-like编程模型,可根据应用负载动态调度计算与内存资源,实现高吞吐、低延迟的HPC/AI运算。

  整套平台可装入单机柜,每卡功耗低于380W,在兼顾算力与功耗的同时显著节省机柜空间,降低整体系统造价。芯动力科技强大的软件生态与开发工具链,使企业和科研机构能够快速部署多卡协同的高算力应用。

典型应用场景

  该平台适用于AI推理、雷达与通信信号处理、工业视觉、高性能数据分析等场景,为客户提供实时、高算力、可扩展、低成本的一体化解决方案。

本文转载自百家号, 作者:百家号, 原文标题:《 面向HPC与AI的多卡GPGPU系统解决方案发布 》, 原文链接: https://baijiahao.baidu.com/s?id=1861138472351931713&wfr=spider&for=pc。 本平台仅做分享和推荐,不涉及任何商业用途。文章版权归原作者所有。如涉及作品内容、版权和其它问题,请与我们联系,我们将在第一时间删除内容!
本文相关推荐
暂无相关推荐