演进中的机柜式架构设计
作者/MDTruongMolex数据中心架构总监
本文引用地址:http://www.amcfsurvey.com/article/201812/396095.htm摘要:在现代化的超大规模数据中心内,重心已经从服务器的设计转向了机架的设计——从而给予我们一种恰如其名的机柜式架构。成立Open19基金会的目的是围绕该型的架构,为数据中心行业提供一个硬件平台,并且还要创建一组可以定制、高度灵活并且极具经济性的标准与设计——同时,这些标准与设计可配合任何19英寸机架环境使用。(因此,出现了Open19。)
通过与全球范围内业界的技术领导者们开展广泛的协作,Open19解决方案的重点围绕在操作的简易性、功率效率以及灵活的设计——对于机架式架构来说,这些都是主要的考虑事项。并且,随着重心正在从以服务器为中心的世界转向以机架为中心的环境,数据中心的管理人员可以突破常规,良好应对一个常见的挑战:运营。
超大规模数据中心会涉及到浩大的运营范围,所占据的区域往往会达到几个足球场那么大的面积。在硬件采购成本的背后,大规模的运行硬件所产生的运营费用可以对总购置成本(TCO)产生显著的影响。在如此大的一个空间中,电源效率(或者,更为常见的是效率不足)、气流阻碍以及硬件的简单维护都会迅速地积少成多起来。为了应对这一问题,这类场所的维护仅仅通过少数几名现场的技术人员来完成,这就意味着维修和升级常会花很多的时间。
开发Open19的目的是应对大规模的挑战。这一协作组织的发起人迄今为止已经包含了近30家公司——包括Molex在内,已经认识到机架集成、操作和维护的成本正在成为一项重大的财务负担,其最初的目标非常简单:降低整合成本,包括在机架上安置硬件、服务器布线和网络连接上花费的时间,以及包扎线缆以利于气流通过的时间。通过与其他领先的技术企业协作,Molex致力于开发出的解决方案可以消除掉这些高昂的整合成本:外部线缆化背板,能够向每个服务器块或者一个半宽的1U高度机架单元服务器提供高达100Gbps的以太网连接。
线缆化的背板解决方案基于背板连接器中所含的相同技术,这类连接器通常部署在内部盲插应用中。这一核心的背板技术经过增强后可以满足新的Open19标准要求,意味着用户可以不再使用高接触的QSFP、QSFP至SFP分支DAC线缆,以及通常用于以太网的5类以太网电缆。成缆的背板改善了气流效果,通过减少安装错误而简化了安装过程,并且为高速以太网提高了信号的完整性。成缆背板安装在壳体内部,可以为十二个服务器块建立起脊状的主干。
1 作为容器的服务器块
运输行业使用的都是一致的货运集装箱来运送货物。在软件世界里,也有容器来以一致的方式来输送软件。然而,在服务器领域,则尚未有统一的惯例。最接近的方法是一种统一的平台,其单元的定义为宽19英寸、垂直高度1.75英寸。Open19致力于为此实现标准化,将Open19生态系统中最小的构建块、也就是服务器块,定义为一个机架单元的半宽服务器,可以支持速度高达100Gbps的连接以及400W的功率。
由于Open19是一种可扩展的架构,可以聚合起各服务器块来扩展功率,并且支持高达100Gbps的以太网络,服务器块的尺寸可以达到标准的1U服务器的大小,而功率和实现的网络速度则可达到标准服务器的两倍,或者,在采用2U服务器的尺寸时,可用功率则可达到2U服务器的四倍(以及高达400Gbps的以太网络连接能力)。背板连接器组专为这一架构开发而成,也将扩展到56GbpsPAM-4——而当今的25/50/500Gbps以太网使用的则是当前的25GbpsNRZ信号系统。随着以太网硅技术的不断演进,每个端口都具有使可用带宽翻倍的潜力。
此外,服务器块是完全自持式的独立设备,含有安全与合规所需的全部相关认证。服务器块可以放入到钣金机壳中,这种机壳提供盲插供电以及成缆干线功能。机壳提供8U和12U的产品变型,分别可容纳16和24个服务器块。通常1U的电源框和1U的以太网交换机即可为这些服务器块提供支持性的基础设施。
2 统一的力量
一致而又统一的设计易于排除大规模操作过程中存在的困难。耗费时间在服务器后部操作的任何人员都懂得,操作以太网连接所需的各种RJ-45端口、SFP端口以及QSFP端口会产生无穷无尽的组合,更不用说还要花很多时间来与身处其他地方、收费高昂的技术人员进行交流,这对于技术人员以及负责解决问题的员工来说都会产生巨大的压力。在开发自身的边缘计算平台的过程中,一家边缘计算和裸金属云计算领域领先的提供商认识到了这一问题。团队立即就认识到了Open19的优势:可以简单而又统一地来部署服务器块。每个服务器块都只能在一个方向上插入并配对。没有外部的以太网电缆会插入到错误的端口中。对于任何可用的插槽,只要尺寸足够容纳服务器块,就可以进行填充。操作的复杂性降低到了接近零的程度。
3 功率的代价
功率、配电与冷却在大规模数据中心内占到了总运营成本的31%。电源使用效率(PUE)是相对于为基础设施提供支持而消耗的功率或者转换损耗而对IT(信息技术)负载使用的电源效率的测量结果,这种损耗在电源将交流电转换为直流电时发生。在接近额定功率下工作时,电源会以峰值效率运行。例如,与1500W电源上的400W负载相比,500W电源上的400W的负载受到的转换损耗会低一些。通过动态的启用和禁用电源框上每个独立的电源,从而对负载需求作出响应,电源框可以降低此类的转换损耗。数百个到数千个机架上的损耗累积起来,可以产生数以百万美元计的运营成本。
Open19设计中的电源框可以为服务器块提供12V的直流电源以及Open19网络交换机。共享的电源框还采用了电缆配电系统,与其他系统中使用的外部直流母线有所不同。电源框还具有100V到277V交流的“通用”输入电压。这种通用的设计允许实施特定于部署地区的电源线,从而排除了部署的后勤方面一个令人头疼的重大问题。
4 打破常规
在机架式的架构中,存在着打破常规的可能性,以全局的方式来解决问题。统一构建块的应用可以使系统的设计人员在计算块的内部创造价值。这类计算块能够部署在机壳的内部,使机壳以均匀一致的方式来供电并提供网络基础设施。从大规模上来看,Open19可以节省可观的总购置成本。边缘解决方案的提供商已经认识到了统一的设计以及架构的一致性所带来的强大力量。
大规模上的运营可以说是孤注一掷的。Open19开发并部署了尺寸一致的硬件容器与硬件块,为商业组织提供了创新性的机架式设计。通过使用成缆背板,在部署了硬件块后可以满足多种应用对于功率和网络的要求,同时还可以解决成规模的运营问题。
在为数据中心的部署评估新的架构时,一个主要的考虑事项就是打破常规,将统一的设计与成缆背板整合起来。这种修改后的架构可使您在专注于自身业务的同时,简化大规模部署中的许多运营问题。
本文来源于中国科技期刊《电子产品世界》2019年第1期第27页,欢迎您写论文时引用,并注明出处
评论