文献阅读:Disaggregated Data Centers: Challenges and Trade - offs

Lin R , Cheng Y , Andrade M D ,et al.Disaggregated Data Centers: Challenges and Trade-offs[J].IEEE Communications Magazine, 2020, 58(2):20-26.DOI:10.1109/MCOM.001.1900612.

分散式数据中心:挑战与权衡

文献阅读:Disaggregated Data Centers: Challenges and Trade - offs_第1张图片

 

《Disaggregated Data Centers: Challenges and Trade - offs》是一篇探讨分解式数据中心(DCs)的论文,分析了其面临的挑战和权衡因素,具体内容如下:

引言

  1. 数据中心资源利用率低,资源分配固定导致资源浪费和成本增加。
  2. 资源分解是提高资源利用率的一种可能方式,分为部分分解和完全分解两种。

资源分解

  1. 专注于机架规模的分解式数据中心,提出了两种完全分解的架构选项,一种是全光互连,另一种是混合互连。
  2. 硬件变化对虚拟机应透明,由管理程序负责资源分配和监控,同时要考虑资源刀片的OI带宽限制和故障影响。

资源间通信

  1. 网络要求:存储和NIC相关通信的延迟和带宽要求较低,可采用商业可用的方法;CPU - 内存通信要求严格,当前商业产品难以支持。
  2. 光学传输:是满足资源通信关键要求的可能解决方案,分为IM / DD系统和相干系统,重点关注IM / DD传输系统,通过复用技术提高互连的每光纤容量,VCSELs和SiP集成电路技术是 transceiver的主要候选者,同时需最小化延迟。
  3. 光学交换技术:电子开关在处理多资源切片同时通信时存在容量和扩展性限制,光学开关更适合分解式DCs,分为慢重构时间和快重构时间的光学开关,主要考虑支持光电路交换的慢切换技术。

性能评估

  1. 使用定制的Python模拟器进行评估,CPU - 内存资源通信通过光电路交换进行,其他类型通信由电子开关支持。
  2. 该模拟器可以模拟不同的资源分解级别、光传输和交换技术以及工作负载。模拟器考虑了资源间通信的延迟、带宽和可靠性要求,并根据这些要求评估了虚拟机(VM)请求的阻塞概率和资源利用率和收入差异。
  3. 结果表明OI带宽是FD场景的瓶颈,提高OI带宽可改善资源利用率和增加收入,但要优于其他场景,带宽需高于800Gb/s。

结论

分解式数据中心有望提高资源利用率,但资源间通信能力不能假设为无限,当前光通信技术的带宽不足可能降低完全分解式DCs的优势,需要推进更高带宽的短距离光传输技术的发展,同时还需进一步研究最优资源分配方案和功能分解带来的潜在能量减少。

背景

一方面。随着全球数据中心中安装的云计算工作负载越来越多,DC 运营商必须增加包括计算、存储和网络在内的 DC 资源的总容量。另一方面,DCs 中中央处理器(CPUs)和内存的利用率相对较低。现代 DCs 中资源利用率低可能与运行应用程序的资源使用多样性与 DCs 中集成服务器中集成的固定资源量之间的不匹配有关,存在着“资源搁浅”现象(也就是说,一个服务器用完了一种资源,即使还有大量其他类型的资源可用,也无法执行更多的工作负载,同样,服务器中一种资源的故障会导致整个服务器的故障,这会显著影响资源的可用性)。

资源分解是避免 DCs 中资源搁浅的一种可能方式。与集成服务器不同,分解意味着不同类型的资源相互解耦,因此在部署

你可能感兴趣的:(内存解耦合,分布式,python)