在全面自主可控背景下,当前以华为昇腾为代表等国产计算生态占比加速提升。
华为昇腾构建了完善的生态体系,在训练和推理两端进行全方位生态布局,核心环节包括硬件、软件、解决方案和生态运营等多个方面。
01
华为昇腾计算概览
昇腾计算是基于华为昇腾系列(Ascend)AI处理器和基础软件构建Atlas人工智能计算解决方案,旨在打造面向“端、边、云”的全场景AI基础设施方案,覆盖深度学习领域推理和训练全流程。
昇腾计算产业生态:
资料来源:昇腾白皮书
02
华为昇腾服务器概览
华为昇腾AI服务器通常搭载高性能昇腾AI处理器,支持多种加速卡,提供灵活的计算资源配置。此外,华为昇腾AI服务器还配备了高速互联网络、大容量内存和高速存储,以满足大规模AI训练和推理的需求。
除了芯片外,昇腾服务器还配备了高性能的CPU、内存、存储等硬件组件,以支持复杂的AI应用场景。鲲鹏920处理器就是华为基于ARM架构自研的高性能CPU,具备强大的计算能力和高能效比,能够满足AI应用场景中对于CPU资源的高需求。
华为昇腾计算Atlas图示:
资料来源:昇腾计算官网
华为昇腾服务器的典型产品包括Atlas800系列推理和训练服务器、Atlas500系列智能边缘服务器等;以及Atlas 900AI集群。
Atlas800推理服务器(型号:3000)是基于华为鲲鹏920处理器的数据中心服务器,可以搭配AI加速卡,提供强大的实时推理能力和视频分析能力,应用于中心侧AI推理场景。面向互联网、分布式存储、云计算、大数据、企业等领域,具有高性能计算、大容量存储、低能耗、易部署等优点。
Atlas800训练服务器(型号:9000/9010):内置多颗昇腾训练处理器,提供强大的AI训练算力,用于深度学习模型的开发和训练,应用于智慧城市、智慧医疗等领域。
Atlas800TA2训练服务器:主要用于AI训练场景,搭载8颗昇腾910BNPU,配备4颗鲲鹏920处理器,总内存达1TB,内置8个200GE光模块,提供强大的AI算力支持大规模AI训练任务。
Atlas800IA2推理服务器:主要用于AI推理场景,搭载昇腾系列推理芯片,配备高性能CPU和内存,支持快速的数据处理和分析,适用于实时性要求较高的应用。
Atlas800服务器图示:
资料来源:昇腾计算官网
此外,Atlas900AI集群系列面向人工智能计算中心等重算力场景,构筑性能领先的训练集群。总算力可达到256P~1024PFLOPSFP16,相当于50万台高性能PC的计算能力,适用于大规模AI模型训练和推理。由上万颗昇腾训练处理器组成,提供极致的AI算力;采用多种高速接口,实现节点间的高效通信。
整体来看,昇腾训练解决方案包含Atlas及伙伴训练硬件、异构计算架构CANN以及基于CANN打造的计算、通信、I/O基础加速库、AI框架(昇思、tensorflow、pytorch)以及基于AI框架打造的SOTA模型、大模型加速以及科学智能套件、MindXDL、以及端到端的训练工具链。
昇腾推理解决方案包含Atlas及伙伴推理硬件、异构计算架构CANN、昇腾推理引擎MindIE、行业应用开发套件MindXSDK,边缘部署使能MindXEdge等。
03
华为昇腾计算生态合作伙伴
