近日,国际权威AI基准评测组织MLPerf™公布最新AI推理(Inference V3.0)榜单,来自全球的主流芯片厂商、系统厂商参与了此次性能评测。利记sbobet股份旗下新华三集团服务器在BERT(自然语言处理)、3D-Unet(医学图像分割)等模型测试中一骑绝尘,获得39项配置第一,展现了新华三在人工智能领域深厚的技术积淀。
MLPerf™基准测试由图灵奖得主David Patterson联合顶尖学术机构发起,在全球AI领域极具影响力。其评测任务与AI领域的前沿应用紧密结合,覆盖当下主流AI应用场景,例如自然语言处理、智能推荐、图像分类、目标检测、医学图像分割场景等,行业用户可根据评测结果了解厂商在AI领域的真正实力,为AI技术的发展和落地提供极大的应用参考价值。
混合算力引擎:21项同配置第一,从容应对大模型AI训练推理场景
H3C UniServer R5350 G6是专门针对ChatGPT这类大规模AI训练和推理场景设计的AI服务器,基于AMD Genoa平台实现了90%的CPU性能提升和50%的内核数量提升,支持GPU/NPU/xPU等多种人工智能加速卡,可应对人工智能不同场景下对异构算力的需求。本次竞赛中,R5350 G6服务器一举夺得ResNet50(图像分类)、RetinaNet(目标检测)、3D-Unet(医学图像分割)、BERT(自然语言处理)等模型任务21项第一:
在 ResNet50 模型任务中,R5350 G6每秒可对183517张图片进行实时分类
在 RetinaNet 模型任务中,R5350 G6每秒可完成对3348张图片中的目标进行识别
在 3D-Unet 模型任务中,R5350 G6在99.9%精度要求下,每秒能处理19.11张3D医疗影像的分割,平均只需十几秒就可以辅助医生完成病灶分析
在 BERT模型任务中,R5350 G6在99.9%精度要求下 ,每秒可实时处理7553次文本分类任务
作为支撑数字化业务的核心基础设施,一方面,H3C UniServer R5350 G6服务器可支持多种类型人工智能加速卡,更借助CPU和GPU挂载比支持1:4、1:8等多种拓扑配置,能够应对人工智能不同场景下对算力的极致需求;另一方面,R5350 G6也具有超大的存储能力,对于The Stack(编程语言代码数据)、BDD100K(自动驾驶)这样的大型数据集来说,更高的存储容量也带来了更快的训练速度。此外,面对AI作业调度、集群管理等难题,新华三集团推出智能算力中枢,为人工智能提供全场景的算力调度,实现了智能标注、智能匹配、智能训练、智能调优、智能推理五维智能的AI开发全流程支持,全面提升AI作业效率达32%,加速数据中心业务腾飞。
此次夺魁,再次彰显了新华三集团在AI计算领域的强劲实力。面向AI时代,新华三将继续围绕真实应用场景需求,在“云智原生”战略的指引下,以内生智能的全面创新为不断提升AI应用效率与能力,以不断进化的数字大脑,引领百行百业迈向智能化新征程。