智算多多



在高性能计算与AI加速领域,传统PC+GPU服务器架构常面临两大难题:一方面难以兼顾高采样率数据的实时采集与确定性响应,另一方面在追求大规模算力时系统扩展性受限,功耗和机柜占用高。
客户在选择AMD Versal™ VM1802 Adaptive SoC时,主要看中其强大的ARM多核处理能力与灵活可编程逻辑,以满足前端高速数据采集和系统控制需求。而芯动力科技提供的多卡GPGPU加速平台,则作为后端可扩展算力解决方案,与VM1802形成一体化异构系统,实现从数据采集到大规模HPC/AI加速的完整链路。
FPGA模块直接对接多通道模拟ADC,保证采集的时间确定性和即时响应;数据通过高速以太网流入VM1802 Adaptive SoC,由系统统一完成缓存管理、任务分发和多卡调度,避免传统多级主机拷贝带来的延迟与带宽浪费。
在多卡GPU协同计算架构中,VM1802 Adaptive SoC运行Linux操作系统,作为系统级调度与控制中枢:由CPU侧统一管理数据流与任务队列,通过DMA机制将数据直接推送至目标GPGPU卡,避免不必要的中间拷贝;同时结合GPU实时负载状态与PCIe拓扑结构,实现跨多卡的动态负载均衡与任务分配,确保算力资源的高效、稳定利用。这一机制是大规模多卡GPU系统实现高吞吐与低时延的关键能力体现。
后端计算部分,芯动力科技平台通过PCIe Gen4+Switch拓扑管理最多7张GPGPU卡,每卡约384TOPS INT8,整个平台可实现2600–2800TOPS可扩展算力。系统支持CUDA-like编程模型,可根据应用负载动态调度计算与内存资源,实现高吞吐、低延迟的HPC/AI运算。
整套平台可装入单机柜,每卡功耗低于380W,在兼顾算力与功耗的同时显著节省机柜空间,降低整体系统造价。芯动力科技强大的软件生态与开发工具链,使企业和科研机构能够快速部署多卡协同的高算力应用。
该平台适用于AI推理、雷达与通信信号处理、工业视觉、高性能数据分析等场景,为客户提供实时、高算力、可扩展、低成本的一体化解决方案。