数字化时代,运营商积极推动高密、高算力等多样性算力基础设施以及超大带宽算力网络基础设施的建设,支撑人工智能、元宇宙、图形渲染等计算密集型业务发展。算力节点的算力密度和网络节点的带宽密度持续提升,推动服务器和路由器功率密度的不断升高,传统风冷机房散热架构面临政策和技术双重挑战。
技术层面,核心路由器单机框整机功耗普遍在20kW~35kW,直接部署在传统电信机房,会成为局部热点,难以有效散热,导致设备工作异常,还可能扰乱冷热气流组织,影响其它相对较低功耗设备的散热。
政策层面,2021年起,发改委、工信部等部门陆续发布新型基础设施绿色高质量发展相关的行动计划和实施方案,针对不同类型数据中心的PUE提出降低到1.3、1.25和1.2以下的要求,明确要求推动数据中心采用液冷、机柜模块化、余热回收利用等节能技术模式。
液冷技术通过较高比热容和换热能力的冷却液体替代传统空气散热,逐步成为一种新型制冷解决方案。液冷技术在数据中心IT设备领域已经有成熟规模的应用部署,并获得了良好的PUE收益。液冷技术在CT设备领域的应用,目前主要聚焦于大容量高功耗的高端路由器,国内主流的高端路由器厂家已有液冷路由器原型并联合运营商进行了现网试点。
液冷方案
液冷方案主要包括冷板式液冷、浸没式液冷和喷淋式液冷技术。浸没式液冷和喷淋式液冷是直接式液冷技术,即通过发热器件与冷却介质直接接触进行热交换,受热升温的液体介质流动到其他低温部位再将热量散出。直接式液冷散热效率高,但存在硬件架构要求高、维护方案复杂、技术成熟度较低、散热能力较弱、工质对信号完整性影响等问题。
冷板式液冷是间接式液冷技术,即发热器件与冷却介质不直接接触,而是通过冷板装置间接进行热交换。冷板式液冷通常是高发热器件液冷+低发热器件风冷的组合系统方案,优点是可靠性、维护性、技术成熟度较高,对现有机房的改造工程小,机房适应性高。
大容量核心路由器一般采用模块化机框式设计,部署时与外部通常有数百根光纤互联,运行期间常见单板/光模块/光纤的安装和更换操作。显然,冷板式液冷更加适合大容量核心路由器的架构设计、部署和运维方式。
大容量核心路由器液冷架构
设备主机液冷系统方案选用风液混合的单相冷板液冷方式:板卡的高能耗芯片通过液冷实现散热,低能耗芯片依然通过风冷来实现散热。液冷部分热量通过外接CDU以及室外冷冻水主机(冷却塔)解决;风冷部分热量依靠机房空调解决。采用前插液冷解决方案,所有单板与分液器连接均采用高性能快速流体连接器,可在线维护;采用微通道冷板设计,结合单板芯片布局采用多冷板并联方案,降低系统流阻。
整个液冷系统主要包括四部分:液冷路由器机柜、液冷CDU、液冷室外冷却塔以及风冷机房空调(见图1)。
路由器机柜系统为热源产生体,设备运行时单板芯片产生热量,液冷板与芯片接触将热量传导到二次侧冷却液中,二次侧冷却液在二次侧管道循环流动将热量带到CDU;CDU内换热器将二次侧热量传递给一次侧冷却液,一次性冷却液在一次侧管道循环流动将热量传递到冷却塔,冷却塔将热量排出到外界环境中,从而完成液冷系统的热量排放。
液冷工质
冷板式液冷的工质分有水工质和无水工质(氟碳)两大类。有水工质具有导热性能好、成本低、环保、数据中心液冷应用广泛等优点,但存在漏液导电导致单板短路烧坏的可靠性风险;无水工质(氟碳)最大的优点是不导电,漏液不会导致单板短路烧坏,主要应用于IT设备浸没式液冷,但存在成本高、环保风险等问题。
由于大容量核心路由器一般位于网络核心汇聚层次,业界早期都选择不导电的无水工质(氟碳)以满足设备极高可靠性要求,随着有水工质的漏液监测和隔离防护技术在液冷数据中心的成熟应用,应用广泛、成本低、环保的有水工质正在成为大容量核心路由器液冷商用部署的新选择。
CDU
CDU液冷源通过二次侧管路为液冷设备提供一定温度和流量的、循环流动的无水冷却工质,将设备产生的热量带回CDU并交换到一次侧传递到冷却塔,最终释放到室外大气中。
CDU提供如下功能:
- 智能温控:提供设定温度和流量的冷却液,具有流量&温度自动调节的智能温控机制;
- 备份冗余:泵1+1冗余设计,关键的温度/压力/流量传感器/过滤器均备份设计;
- 异常检测:无水工质漏液检测、过滤器杂质拦截与自动堵塞检测、高温&高压检测;
- 运营维护:具有自动补液功能;具备故障诊断&设备保护功能;具备掉电记忆功能。
分液器
分液器安装在液冷机柜内,连接二次侧管路和液冷板,起到流量分配作用,将系统的循环工质分配到各单板节点。分液器推荐选用不锈钢材质;内部流速不宜超过1.8m/s,以保证流量分配均匀性。
液冷板
液冷板与发热器件接触,将器件产生的热量传递到液冷板内部腔体中的冷却工质中,冷却工质在液冷板腔体中循环流动从而实现器件热量的持续排出。液冷板宜采用全金属方案,即各个芯片冷板之间通过金属管路进行连接,金属管路与芯片冷板之间焊接成型,密封性高、冷却液泄漏风险低,可靠性更高。
流体连接器
流体连接器主要用于液冷板与分液器的连接,主要有两种方式:
- 直插流体连接器:连接功能可靠性高、可维护性高;直插方式另外需要液冷软管将液冷板与分液器进行互联。
- 盲插流体连接器:提升操作性、整机外观更简洁。
应用实践
路由器液冷是一项创新性的改革,它解决了路由器发展过程中芯片高热流密度散热瓶颈问题,提供了噪声更小、功耗更低的新型冷却方式, 应用前景光明。目前,中兴通讯液冷高端路由器产品已在国内运营商市场进行了试点,液冷散热在以下方面达到了预期效果:
- 冷却效果更好:液冷能更为直接地对高功耗芯片冷却,芯片温度与采用风冷的设备相比降低10°C~15°C。
- 降低设备噪音:液冷带走了大部分热量,能够减少系统内的风机数量及转速,从源头降低系统噪音。整机风机转速可降低30%,噪声水平降低6dB以上。
- 节约机房能耗:冷却液能高温(45°C+)运行,直接与冷水机组或室外环境换热,提高换热效率。
展望未来,在“双碳”目标的牵引下,液冷技术将日趋成熟,大容量核心路由器液冷商用部署指日可待。中兴通讯将秉承创新与迭代、携手客户共同推进“双碳战略”的持续发展目标,为节能减排做出更大贡献。