成都服务器总代理_液体冷却是未来人工智能增长的下一个关键

Admin 426 2022-04-28 17:38

Lenovo-Neptune-1030x438.jpg

在过去几年中,大规模 AI/ML 的限制因素首先是硬件能力,其次是复杂软件框架的可扩展性。最后一个障碍不太明显,但如果不克服,可能会限制计算和算法领域的可能性。


最后一个限制与计算组件的关系不大,而与冷却那些处理器、加速器和存储设备有关。之所以没有更广泛地讨论这一点,是因为数据中心已经拥有足够的冷却能力,通常是空调机组和标准的冷通道、热通道实施。


目前,仍然完全可以使用风冷服务器机架进行管理。事实上,对于需要一个或两个 CPU 的一般企业应用程序,这是可以接受的规范。然而,特别是对于人工智能训练,以及它对 GPU 的依赖,人工智能能力的持续增长意味着对系统冷却方式的彻底重新思考。


除了最大的超级计算站点之外,世界上从未见过将这种超密集的人工智能专用计算服务器打包到单个节点中。AI 训练系统不是两个 CPU,而是至少有两个高端 CPU 和额外的四到八个 GPU。功耗从普通企业级服务器的 500 瓦到 700 瓦到单个 AI 训练节点的 2,500 瓦到 4,500 瓦之间。


想象一下计算马力产生的热量,然后想象一个空调装置试图用冷空气冷却它。对于这种每机架的计算和热量密度,有一点很清楚,那就是没有办法吹出足够的空气来充分冷却地球上一些最昂贵、高性能的服务器设备。这会导致计算元素受到限制,或者在极端情况下会导致关闭。


这给我们带来了另一个因素:服务器机架密度。随着数据中心的房地产需求处于历史最高水平,最大化密度的需求正在推动新的服务器创新,但冷却只能通过在机架(可以驻留更多系统的地方)留出空隙来让空气保持跟上。在这些情况下,空气冷却不足以完成任务,而且还导致每个机架的计算量减少,因此服务器机房空间浪费更多。


对于在双 CPU 服务器上具有单核作业的普通企业系统,问题可能不会很快复杂化。但是对于密集的 AI 训练集群,需要大量的能量来引入冷空气,在后端捕获热量,并将其恢复到合理的温度。这种消耗远远超出了为系统本身供电所需的消耗。


通过液体冷却,您可以更有效地去除热量。正如联想 HPC 服务器和人工智能欧洲、中东和非洲地区总监 Noam Rosen 所解释的那样:“当您使用温水、室温水来去除热量以冷却组件时,您不需要冷却任何东西;您无需投入能源来降低水温。当您获得进行大规模 AI 培训的国家实验室和数据中心的节点数量时,这将变得非常重要。”


Rosen 通过对几种常见大型 AI 模型的训练进行生命周期评估,指出了定量细节,以比较一般企业机架级电源需求与 AI 训练所需的电源需求。他们检查了自然语言处理 (NLP) 的模型训练过程,发现 NLP 训练过程可以排放数百吨碳,相当于普通汽车寿命排放量的近五倍。


“从头开始训练新模型或将模型应用于新数据集时,由于调整现有模型所需的持续时间和计算能力,该过程会排放更多的碳。因此,研究人员建议行业和企业齐心协力,使用更高效、运行所需能源更少的硬件。”


Rosen 通过强调联想的 Neptune 系列液冷服务器在传统空气路线上的作用,将温水冷却置于鲜明的背景下。“如今,可以在一个机架上安装一百多个 Nvidia A100 GPU,所有这些都在一个机架中。唯一的方法是使用温水冷却。相同的密度在风冷机架中是不可能的,因为所有空插槽都可以让空气冷却组件,即便如此,它也可能无法解决来自那么多 GPU 的热量。”


根据服务器配置,温水冷却可以带走 85% 到 95% 的热量。罗森解释说,由于水的允许入口温度高达 45°C,在许多情况下,不需要耗能的冷水机,这意味着更大的节省、更低的总拥有成本和更少的碳排放。


对于出于某种原因无法为其数据中心添加管道的客户,联想提供了一个系统,该系统具有完全封闭的液体冷却回路,可增强传统的空气冷却。它为客户提供液体冷却的好处,而无需添加管道。


目前,在具有超高密度的 AI 训练中,以及对更多计算的需求不断增长,以支持地球上一些最大的数据中心运营商的未来 AI/ML,唯一的途径是流动的——这只是来自数据中心和计算视角。对于进行任何规模的人工智能培训的公司来说,更大的动机应该是控制碳排放。幸运的是,通过高效的液体冷却,排放得到控制,电力成本被削减,密度可以实现,并且有了好的模型,人工智能/机器学习可以继续改变世界。


【公司名称】四川旭辉星创科技有限公司

【代理级别】成都联想服务器工作站总代理

【销售经理】熊经理

【联系方式】座机:028-85596747    手机:18244236404

【公司地址】成都市人民南路4段 桐梓林 商鼎国际2号楼1单元1913

售前优惠咨询专线

13438344046(手机) 13438344046(手机) 028-85596747(销售专线)

售后保修咨询专线

028-85596747

在线咨询

售前咨询

请用微信扫描二维码

2.667704s