突破电气积极推动浸没式液冷技术发展 - 董事长林海青先生接受媒体专访

2024-08-30 来源:网络 阅读:1552

随着人工智能、大数据、云计算等技术的迅猛发展,全球对算力的需求呈现指数级增长。特别是在大模型、AIGC(生成式人工智能内容)等新兴领域的推动下,算力已经成为现代科技发展的关键基础。伴随着算力的不断提升,高功率密度设备的得到广泛应用,这使得传统的风冷在散热效率和能源消耗方面逐渐无法满足需求。浸没式液冷技术因其卓越的散热性能和显著的节能优势,正逐渐被视为下一代数据中心和算力中心的主要散热方案。

近日,针对浸没式液冷发展等议题,突破电气林海青董事长受邀接受腾讯专访。

1.jpg

1. 能否请您简单介绍一下突破电气的历史沿革及其在行业中的定位、地位?

  突破电气有三十年的历史,1995年成立于中国北京中关村。第一个二十年,我们成就了一家“家用以及类似用途插头插座”的品牌企业,可以自豪的讲,是移动式插座行业的首家品牌企业;2014年与小米公司合资成立生态链公司青米科技,其推出的强弱电结合、带USB输出小米插座成为当年市场热点和爆款,此外我们开始入局手机远程控制强电的智能化应用(IoT)。青米科技也是小米生态链企业中最早与资本市场结合的企业。突破电气把民用ToC的产品线剥离,和雷军合资成立小米生态链后,将已经培育了20年的ToB的产品线作为公司新发展定位,定位于数字基础设施关键产品提供商,从已经培育多年的PDU产品线基础上,通过再7年的发展,已经成为全球生产能力最强,产品线最丰富的PDU产品企业之一,特别是大功率、智能化产品,在这个精细的市场上得到业内认可,并获得专精特新“小巨人”称号。

在智能母线产品上,我们是唯一一家与国际品牌没有专利冲突的中国企业。节能微型一体机、工业连接器、电连接器也已经成为行业翘楚。

2. 分享一下突破电气在浸没式液冷技术领域的研发历程吗?

很多年前,突破在为数据中心和超算企业提供PDM、智能母线、智能PDU等产品的过程中,认定IT设备特别是GPU芯片、大功率服务器的功能提升的瓶颈是局部散热瓶颈和整体散热能力,同时另一个关键技术痛点是能耗比,也就是PUE值(总耗用功率/IT设备的耗用功率)。在这个应用场景中,哪条技术路线能够跑成熟,将对高功率GPU等芯片的进步和发展以及成为高算力、高密度算力提供支撑并为数据中心绿色节能能力做出关键贡献。

为应对GPU功耗不断提升对散热能力提出的更高要求,目前有两种主要的技术路线可供选择:风冷技术和液冷技术。

风冷技术在GPU单芯片功率达到300W以上会面临挑战,单芯片达到500W功率,风冷的能力将达到极限。

液冷技术路线分成两个技术路线,背板液冷技术路线和浸没液冷技术路线。背板液冷技术路线在这些年被相对广泛的应用,目前可以解决GPU单芯片功率500W左右的散热需求,但背板液冷技术路线在单芯片超过700W功率的时候也遇到局部散热瓶颈,其应用过程中的一些技术问题也逐步暴露,遇到进步瓶颈。

浸没液冷技术路线又分成两个技术路线,双相浸没液冷技术路线和单相浸没液冷技术路线,这两种技术路线都是使用高度绝缘的介质作为散热媒介。双向浸没液冷技术一般是指专项配置的液冷液体的沸腾温度在50度左右,利用绝缘介质气化过程中的汽化潜热能力为芯片降温(汽化会吸热。单位质量的液体转变为相同温度的蒸气时吸收的热量称为汽化潜热,简称汽化热),而单相浸没液冷技术路线是利用绝缘介质在芯片表面形成液流而带走热量对芯片进行散热。

我们在多年前认定,浸没液冷技术(单相和双相)是解决高功率芯片散热的终极解决方案。目前当单芯片功率超过700W,单GPU服务器超过5000W,浸没液冷技术路线将成为主流。这一点通过这几年的行业共同探索,基本形成共识。

3. 您认为浸没式液冷技术对于算力行业意味着什么?

意味着高功率芯片的散热瓶颈得到突破;高密度算力瓶颈得到突破;PUE小于1.1得以实现;IT设备、服务器静音得以实现;IT设备、服务器实现IP67的防护水平。

4. 突破电气在浸没式液冷服务器领域积累了哪些核心技术?这些技术如何帮助公司处于领先地位。

突破电气在浸没式液冷服务器领域已经攻关研发的技术和工艺积累包括:

冷却介质兼容性和稳定性技术:冷却介质质的材料兼容性和稳定性达到相关标准;

冷却介质全时管理技术:实时对冷却介质健康程度进行监测,实现安全可靠运行管理技术;

热导技术:CPU或GPU等发热元器件散热,专项设计的特殊材质,特殊工艺的散热器(散热片),可极大降低热阻,提升冷却介质热交换效率;

PACK级别池沸腾管理技术与工艺:热量的急速交换与液流管理技术与工艺;

冷量分配技术:单机柜通常会布置多余台液冷服务器,每个液冷服务器最高热功耗目前设定目标是5KW。正常工作时,各个服务器的热功耗是不固定的,且高低分布并不均匀,GPU位置不同,如何使得每个服务器根据需要的冷量来及时供给,可靠供给,冗余供给是智算单元可靠,稳定运行的关键。我司采用的冷量双供给技术、在线技术,自动分液技术、液压动力技术可以实现需配置冷量,达到及时,可靠和冗余的目标;

换热系统常压实现技术与工艺:在换热系统中,有源动力技术,使得系统内压力趋于大气压,系统密封和运行会更可靠;

液冷服务器的密封技术与工艺:液冷服务器达到IP68的防护等级 ;

液冷服务器模块化运维技术:液冷服务器模块化设计实现对易损部件,安装部件的运维便利,如硬盘,电源,网口、USB、HDMI等端口连接。

5. 可能很多关注液冷技术的专业人士都知道,液冷技术最近几年都是市场热度很高的板块,很多大企业都在布局。那突破电气在液冷服务器技术上是否有自己的独特之处?您认为哪技术有可能改变行业格局?

突破电气在双项浸没液冷技术中,实现了全年自然冷却模型,

改变行业传统格局,使得PUE值真实实现1.1以下。

6. 据了解,不同于其他开发浸没式液冷技术的公司,突破电气在浸没式液冷剂的原研与开发也投入大量精力,咱们为什么要这样做,能请您简单介绍一下吗?

浸没液冷技术是需要颠覆性突破创新的一个技术。目前全球多家公司基本处在一个起跑线上。浸没液冷,包括双相液冷液体的浸没液冷技术路线和单相液冷技液的浸没液冷技术路线。需要做大量的技术、设计与工艺的创新以及工程化的转换工作。理论上比较容易理解,举例:相变液冷液是一个高绝缘的液冷介质,利用其相变气化潜热形成高效率热交换,再通过环境温度低于相变温度,只需要通过常温热交换就可以实现液冷液体从气态转化成液态进行循环。而要实现该技术路线需要做的颠覆性的突破很多很多。

●液冷液的性能稳定性、长时稳定性;

●性能优化与筛选;

●液冷剂的导热性、绝缘性和稳定性是决定浸没式液冷系统性能的关键因素;

●液冷剂的毒性、生物富集性以及环保特性验证;

●液冷液在芯片表面的热交换的稳定性与冗余度;

●液冷技术在PACK 液体气体、液冷液与IT部件、材料的相容性、适应性与兼容性;

●数据中心服务器的平均使用寿命超过5年,而目前运行超过5年的浸没式液冷方案几乎没有,测试标准也存在较大差异。我们在研发中投入了大量精力,研究长周期浸没设备的材料兼容性,以及常温和高温环境下材料反应和金属析出对系统和液冷剂的影响;

●全周期健康监测与酸化趋势研究:除了初期的兼容性研究,我们还关注长期系统状况的监测。我们研究了氟化液中的游离氟在相变浸没式冷却系统中对液体酸化趋势的影响,通过监测氟化液的质量指标和服务器接触材料性能的变化,确保系统的长期稳定性;

●成本控制与再利用性:长期以来,行业对浸没式冷却能否大规模部署存有疑问,部分原因是海外品牌长期高昂的价格。通过自主研发和生产,我们不仅能够持续研究和严格控制质量,还能够进一步降低电子氟化液的使用成本;

●液冷剂回收再利用服务,形成了完整的售前、售中、售后服务闭环,这是我们方案的一大独特优势。

7. 能否详细介绍下“解耦合”这个词?

耦合是指系统内部的各个部分之间存在相互依赖、相互影响、相互制约的情况。“解耦合”就是两个或多个系统或组件之间互相影响小,互相依赖的程度低。突破在浸没液冷技术路线上研发的目标是强解耦合模式。其产品可以适配各芯片厂商的各规格芯片,适配各厂家的服务器和IT设备。这是一个开放系统,将使得浸没液冷技术的广泛使用形成良好的生态系统。

目前,大部分服务器企业的浸没液冷技术的研发技术路线是强绑定的模型,技术应用是封闭,非开放的。用户一旦选择必须进行强绑定服务器的品牌,这对于浸没液冷技术路线的推广和普及会形成不利的影响。

8. 您能谈一谈突破电气是如何与其他企业及科研机构合作来推进浸没式液冷技术项目的发展历程的吗?

突破助推上海有机化学研究所相关研究的成果转化,推出一系列不同沸点的稳定的液冷介质,47℃沸点的介质适用浸没相变液冷技术路线,110℃沸点的介质适配浸没单相技术路线,与专家共同研究介质在不同产品应用上的配方、生产、服务、回收再造等,继续进行相容性验证试验和场景应用检测。

突破与北京交通大学相关研究机构共同研发微尺度、环境散热技术与,研发池沸腾技术,研发液冷芯片散热片、散热器,研发PACK池沸腾的平稳技术和装置。

目前看,解决超过700W单器件散热已经可以投入商用,突破正在攻关700W-1200W单芯片和5KW双相液冷服务器的工程样机,并着手进行相关验证。此外,突破正在研发验证2000W单芯片,单位热流密度300W/cm2的散热技术。

9. 突破电气在国际市场的布局和表现如何?未来会有哪些扩展计划?

突破电气着力开拓海外市场,首先在新加坡和美国布局品牌和营销,开始在外海建定制工厂。公司已经将作为全球数字基础设施关键提供商作为定位,成为行业领导着作为目标。

积极参加国内外展会,研发对标全球领先的产品。现有在产品技术参数和功能上领先。和行业内一些全球知名企业建立了长期合作关系。

突破在国际市场已经多次露出浸没液冷方案技术和产品样机和工程机。

10. 您对当前及未来市场环境下液冷服务器的需求增长有何看法?公司如何应对这一趋势?

我们正目睹AI技术“引爆”了对算力的需求。未来30年,AI的发展可能会像电力取代蒸汽机那样,带来革命性的进步力量,推动经济和社会结构的重大变革。

目前随着AI的迅速发展,高功率服务器成为趋势,最先进的智算中心,制冷和配电的结构都产生巨大变革。H100芯片容量已经达到700w,GB200芯片将达到1400w,这种高功率芯片必然使得液冷成为首选,下一代GB200芯片搭载的单机柜容量将上升到120kw,这个功率密度已经成为行业共识。常规冷板液冷在单芯片700W面临瓶颈。浸没液冷将有更多应用。    

突破已经掌握浸没液冷剂技术和产品,开发成功拥有自主知识产权的双相浸没液冷服务器、高密度智算站,已经针对性的开发适应于液冷产品线的系列大功率智能配电产品和专业连接器产品。

11. 能否透露一些关于突破电气未来几年浸没式液冷技术方面的布局和规划?

突破计划推出高解耦合的液冷服务器和配套的高算力密度的智算站。

12. 对于想要进入液冷服务器市场的初创企业,您有什么建议?

做解耦合产品。倡导开放系统,避免封闭产品线技术路线。使得浸没液冷技术能够商用化,解决痛点。

13. 最后,您对突破电气未来的发展有何期待?

突破将继续在数字基础设施关键产品提供商的定位下深耕、发展。市场赛道对,行业发展增长速度可期待,我们的团队素质可支撑。希望我们从中国的“小巨人”和“领军企业”(专业化市场)成为行业的全球企业。



延伸 · 阅读