资源池化提升硬件利用率,智算中心升级之路

发布时间:2022-04-18

随着云计算和云服务的发展,越来越多的企业开始加快将业务迁移到云端,通过上云解决了传统IT基础架构中的诸多问题,提高了自身的产业价值和运营效率。近年来,传统数据中心跟随着云计算的脚步升级为云数据中心,将计算、存储、网络等基础架构资源进行池化,用户可根据实际需求租用相应资源。数据中心也渐渐成为了云计算、云服务、人工智能等新兴应用的重要载体。

 

 

与日俱增的数据中心应用和类别,在数据类型、工作负载等方面都有着各自的侧重点:某些应用偏重于计算,对CPU和内存的要求较高,属于计算密集型。某些应用更偏重于提供数据的存储和传输服务,对存储的性能和网络带宽要求更高,属于I/O密集型。

 

因此,计算、存储、网络资源配比固定的传统服务器是很难对应不同的业务进行资源分配。比如在通用平台上运行某一种I/O密集型应用时,效率往往达不到理想状态,并且还影响整体成本:对于计算密集型应用,CPU、GPU、内存数量都会影响计算密度;计算密集型应用中的存储槽位和存储类型并不是那么重要;I/O密集型应用中CPU与内存配置过高,也会造成浪费。

 

为了可以灵活弹性地部署计算、存储、网络资源,提高IT资源利用率,更有效地提高服务器的故障修复能力,提升服务器运营效率,资源池化这个概念被提了出来。硬件厂商和各大互联网公司对软硬件资源池化也都在进行着不断探索,其中Intel率先提出了RSA(Rack Scale Architecture)架构,Google则与伯克利大学共同提出了WSC(Warehouse Scale Computer)。

 

 

以Intel的RSA架构为例,通过将整个架构中的几种重要资源按类别进行解耦合,产生CPU池、内存池、存储池。资源池化后的架构在软件应用的角度依然可视作为一台拥有CPU、内存、硬盘等硬件的传统服务器,并且可将资源更为合理地分配到不同负载侧重的应用上,方便管理和扩展,降低运行维护成本。

 

大型数据中心可以按照业务需求选择相匹配的CPU池、内存池、存储池规模,例如为大数据应用从存储池中分配更大容量,HPC应用从CPU池中分配更高性能,从而实现更为灵活的云服务架构。并且各类资源池通过合理分配,提高了利用率,从而减少TCO成本。

 

但资源池化也面临着不少挑战,比如,在存储池中拥有大量HDD和SSD,面对不同的应用负载都需要满足不同的响应级别。对于在线业务来说,存储必须提供极短的响应延迟,多线程的同时读取和写入保持更稳定的传输带宽和延迟,同时保证数据的可靠性。宝存科技PCIe Gen4 SP4E/SP4X系列固态硬盘通过固件定制及调优,将99.99%稳态延迟降低到10ms以内,满足不同应用负载的快速响应要求;针对读密集型负载SP4E提供370K IOPS的7:3混合读写性能,给客户带来更好的效能体验,还提供高于业界标准的1.3*5Years DWPD,确保耐用性,结合资源池化技术,提供高弹性、高密度的存储解决方案,灵活应对各种上层应用对下层IT基础架构的动态需求。