近日,英特尔专门针对中国市场推出了深度学习加速器Habana® Gaudi®2。 凭借领先的性价比优势,加速AI训练和推理,提升深度学习性能和效率,成为AI大规模部署的更好解决方案。 作为英特尔在中国最重要的战略合作伙伴、中国AI服务器市场排名前三的宝德计算积极与英特尔合作,推出支持8颗Gaudi®2加速器的AI加速计算服务器——PR8908WG,具有高性能、可扩展性强、高能效、开箱即用等优势。
全新 Gaudi®2 训练加速器,专为深度学习而设计
Gaudi®2采用7nm工艺技术,拥有高性能架构,拥有24个可编程Tensor处理器核心(TPC)、21个100Gbps(RoCEv2)以太网接口、96GB HBM2E内存容量、2.4TB/s总内存带宽、48MB片上SRAM,并集成多媒体处理引擎。 为训练大型语言模型提供高性能、高扩展性、高能效的AI算力。 在GPT-3模型中,计算机视觉模型ResNet-50、Unet3D、自然语言处理模型BERT都取得了优异的成绩。
生成式人工智能和大型语言模型需要服务器集群来满足大规模和更复杂的计算需求。 作为一款高性能、完全可编程的AI处理器,Intel Gaudi®2处理器集成了多项技术创新。 具有基于标准以太网技术的高内存带宽/容量和垂直扩展能力,支持使用外置网卡通过PCle接口实现水平扩展,可满足多节点集群的需求。 同时,英特尔持续打造领先、成熟的软件生态支持。 SynapseAI®软件套件针对Gaudi平台的深度学习业务进行了优化。 它集成了对TensorFlow和PyTorch框架的支持,并提供了许多流行的计算机视觉和自然语言参考模型,可以满足深度学习开发人员的多样化需求。
宝德AI服务器PR8908WG+ Gaudi® 2、大型模型算力新选择
保德AI服务器PR8908WG采用第三代Intel® Xeon®可扩展处理器,8U空间支持8个OAM高速互连Gaudi®2 AI加速器,每颗Gaudi®2芯片配备96GB HBM高速内存,GPU与GPU之间互连带宽达到400GB/s,提供2.1Tbps P2P互连带宽,支持全互连拓扑,充分满足大规模模型训练的海量通信需求; 支持200Gb ETH和HDR高速智能网卡支持GPU Direct RDMA,完美满足集群和超大规模扩展应用。
PR8908WG 拥有 32 个 DDR4 DIMM 插槽,最高支持 8TB 32x 256 GB DRAM; 支持24个2.5英寸SAS/SATA热插拔硬盘托架,默认支持8个直连SATA硬盘,4个NVMe U.2 SSD,内置2个NVMe M.2 SSD,实现CPU直通设计,降低I/O延迟; 提供2个PCIe 4.0 x16 FHFL插槽和2个PCIe 4.0 x8 FHFL插槽; 支持各种网络选项和互连需求,例如以太网、InfiniBand、OPA等。
PR8908WG整机采用模块化设计,独立的GPU和CPU热分区设计,确保在最苛刻的工作负载下,系统的性能和稳定性不会受到影响; 同时,该板集成BMC,支持RAID卡超级电容,支持IPMI 2.0远程管理等,非常方便用户维护和管理AI算力设备。
综上所述,宝德AI加速计算服务器PR8908WG可以满足不同AI场景下海量数据的计算和推理需求,特别适合大模型训练和推理、深度学习、自动驾驶、智慧城市、医疗健康、大数据、高性能计算(HPC)和虚拟现实等应用场景,有助于加速更多AI技术的落地和应用。
大模型将为AI带来新价值,“百模型时代”已经到来。 随着各种模式的竞争以及对成本和盈利模式的日益重视,性价比将成为AI算力的新标准。 作为国内领先的计算产品解决方案提供商,保德计算将继续发挥在AI服务器领域的技术优势和市场经验,与英特尔等合作伙伴持续创新,探索大规模模型算力的更多选择,打造更具性价比的AI算力和解决方案,助力中国大规模模型发展。
搜虎网转载此文目的在于传递更多信息,不代表本网的观点和立场。文章内容仅供参考,不构成投资建议。投资者据此操作,风险自担。