• 高性能计算服务

紫金云超算中心分成两期建设,第一期建设计算能力为2.73P,二期将在扩展3P计算能力,整体达到5.7P计算能力。 

第一期(已建设完毕):紫金云超算中心完成大型超算中心软硬件框架搭建,软件部分完成高性能软件系统及云数据交换平台建设包括了:包括容器系统、一体化超算管理系统、集群管理系统以及集群调度系统建设,硬件部分完成2.73P算力平台包括:登陆节点、管理节点、计算节点、GPU计算节点、并行存储系统、并行计算网络、管理网络等。建设完备的网络基础安全以及出口带宽,并构建完整的紫金云超算中心技术服务支持团队。 

第二期:在第一期项目的基础上,增加3P计算能力,将紫金云超算中心平台计算能力扩展到5.7 PFlops,使之成为西北最大的商业应用算力服务中心。 



(紫金云超算平台架构图)

 

紫金云超算中心平台基于业界主流超算体系采用Intel X86集群架构建设,分为计算系统(高密度机架式计算节点和GPU节点两类)、存储系统、网络系统、登陆管理系统、集群系统软件等组成部分。 

已建设完毕的总计算峰值达到2.73P,其中CPU计算峰值798 TFLOPS,GPU节点计算峰值1940 TFLOPS。高密度计算节点采用风冷2U4节点服务器,配置100台计算节点,采用目前最先进的Intel Gold 8358 32C 2.6GHz处理器。GPU服务器配置50台,每台GPU服务器采用了4块Nvidia A100 GPU卡 ,以满足科学计算、人工智能等应用场景。存储系统采用并行存储系统架构,存储系统裸容量近10PB,总聚合I/O读带宽:50GB/s,写带宽:45GB/s;计算、存储网络采用目前业界最先进100Gb HDR Infiniband高速网络,实现计算和存储网络融合设计,全线速无阻塞。 

紫金云超算中心将打造西部科学计算及人工智能超算数据中心,通过超算中心的高性能计算能力,将进一步助力科学研究、人工智能、深度学习等国内高科技领域和尖端技术研究的突破,为下一代技术突破、人工智能拓展应用提供坚实的基础。同时,通过培育人工智能“东数西算”产业基地,承接东部地区大数据、人工智能、区块链等企业低延时超算业务需求,面向东部人工智能企业提供计算力、人工智能和深度学习模型训练等关键业务支撑。 

       附件下载:甘肃紫金云高性能计算平台用户试用上机申请表.doc