隨著AI算力的爆發式增長與“東數西算”工程的深化推進,數據中心功率密度持續攀升,傳統風冷技術已難以突破散熱瓶頸。液冷作為高密算力場景的核心散熱方案,在2025年迎來規模化落地臨界點。其中,浸沒式與冷板式兩大技術路線的選型之爭,成為企業布局AIDC(人工智能數據中心)的關鍵決策。尤其在東數西算政策導向與碳中和目標約束下,兩者的性價比差異被賦予更復雜的場景內涵。本文將從技術特性、成本結構、政策適配、碳中和貢獻四大維度,拆解兩種方案的核心差異,為不同場景下的AIDC選型提供參考。
一、技術基座:從“局部降溫”到“全域散熱”的核心分野
浸沒式與冷板式的技術差異,本質是散熱邏輯的不同——前者以“全域包裹”實現極致散熱,后者以“精準靶向”平衡效率與兼容,這種差異直接決定了兩者在高密算力場景的適配邊界。
冷板式液冷屬于“間接接觸”散熱,通過銅/鋁冷板與CPU、GPU等核心發熱器件貼合,利用水基乙二醇溶液等冷卻液在封閉管路中循環帶走熱量。其核心優勢在于兼容性強,無需對現有服務器架構進行大幅改造,可直接適配傳統風冷數據中心的升級需求,部署周期短至72小時內。但受限于“局部冷卻”邏輯,冷板式僅能覆蓋60%-70%的總熱負荷,剩余熱量仍需依賴風冷輔助,導致PUE值難以突破1.1-1.2的區間,且易出現內存、電源等部件的局部熱點問題。在功率密度適配方面,冷板式單機柜功率上限約60-80kW(單相)或130kW(雙向冷板),可滿足多數中低功率AI訓練需求。
浸沒式液冷則采用“直接接觸”散熱,將服務器完全浸沒于絕緣冷卻液(氟化液、礦物油或國產煤基介電液等)中,通過液體顯熱或相變潛熱實現全域散熱。這種設計徹底擺脫了風冷依賴,PUE值可低至1.03-1.08,單相系統單機柜功率密度可達100-150kW,兩相系統更是突破200kW,能完美適配英偉達Rubin系列等下一代高功耗芯片的散熱需求。同時,全域散熱使設備溫度均勻性誤差小于±2℃,徹底消除局部熱點,且無需風扇組件,噪音降低90%以上,還能減少灰塵污染以延長設備壽命。但代價是系統復雜度提升,需定制化密封機柜與防腐蝕服務器,冷卻液成本占比高達60%,生態兼容性仍在完善中。
二、成本博弈:短期投入與長期收益的全生命周期權衡
性價比的核心是成本與收益的匹配度。對于AIDC項目而言,成本考量需覆蓋前期建設與后期運維的全生命周期(TCO),而東數西算場景下的地域差異(西部能源成本低、東部土地成本高),進一步放大了兩者的成本差異。
(一)前期建設成本:3-4倍的投入差距,定制化是核心溢價
冷板式的前期成本優勢顯著,單機柜總投入約8-12萬元,僅為浸沒式的1/3-1/4。具體來看,冷板式設備成本約5-10萬元/機柜,冷卻液采用低成本水基溶液,成本可忽略不計;部署階段無需大規模改造機房,僅需增加泵組和冷卻塔,附加成本約2-5萬元/機柜。這種低成本優勢使其成為存量數據中心改造的首選,例如阿里云張北數據中心的冷板式升級項目,單機柜投入控制在10萬元以內。
浸沒式的前期投入則面臨雙重溢價:一是定制化硬件成本,專用密封機柜、防腐蝕服務器(PCB板需防腐蝕涂層)等設備單價較高,單機柜設備成本達15-25萬元;二是冷卻液與部署成本,3M氟化液等高端介質單價1.5-3萬元/升,單機柜需數百升,疊加地面承重改造、防泄漏設施等費用,單機柜總投入高達30-40萬元。不過2025年以來,國產替代趨勢正在緩解成本壓力,國產氟化液使冷卻液成本下降30%,潞安太行煤基介電冷卻液等本土介質更實現了性價比突破。
(二)后期運維成本:高能耗節省 vs 高介質維護的此消彼長
運維成本的差異核心在于“冷卻液維護”與“能耗節省”的對沖。冷板式的年均運維成本約0.5萬元/機柜,主要包括去離子水定期過濾(0.3萬元/年)與風冷輔助系統維護(0.2萬元/年),冷卻液基本無需更換,僅需應對5%-10%概率的冷板堵塞風險,單次清洗成本約0.5萬元。但其節能收益相對有限,較風冷僅節省20%-30%的電費。
浸沒式的年均運維成本較高,約2-3萬元/機柜,主要來自冷卻液純度監測(1-2萬元/年)與定期更換費用(氟化液5-8年更換一次,單次成本10-15萬元/機柜),且服務器維修需停機排空冷卻液,人工耗時增加20%-30%。但極致的節能效果形成了顯著對沖:較風冷節省40%以上電費,且高溫冷卻液可直接用于區域供暖,余熱回收效率達90%。在西部能源成本較低的場景下,這種對沖效應更為明顯——模擬數據顯示,高密度AI場景下,浸沒式5年TCO可反超冷板式,電費節省足以抵消前期高投入。
三、場景適配:東數西算下的地域分工與需求分層
東數西算工程的核心邏輯是“東數西存、東算西訓”,東部樞紐聚焦低時延算力需求,西部樞紐承擔高時延、高算力訓練任務,這種地域分工直接決定了液冷方案的選型優先級。
東部樞紐:冷板式的“主戰場”。東部地區存量數據中心密集,且多承擔在線推理、政務數據處理等低時延需求,對改造周期與兼容性要求極高。冷板式無需重構機房的優勢的在此場景下被最大化,可快速實現單機柜功率從40kW到60kW的提升,同時將PUE從1.6降至1.3左右,契合東部地區“存量升級、快速投產”的需求。此外,東部土地成本高,冷板式無需大規模改造基礎設施的特點,可進一步降低場地占用成本。政策層面,北京、上海等東部省市對液冷采購給予最高30%算力券補貼或300元/kW的項目補貼,進一步放大了冷板式的短期性價比優勢。
西部樞紐:浸沒式的“增長極”。西部樞紐(甘肅慶陽、寧夏中衛等)能源豐富(風電、光伏等可再生能源占比高)、土地成本低,是AI訓練、超算等高密算力場景的核心承載地。東數西算政策明確要求西部新建數據中心PUE≤1.25,而浸沒式1.03-1.08的超低PUE可輕松達標,且能通過余熱回收實現能源二次利用——例如潞安太行的智慧礦山項目,采用浸沒式液冷后年減排二氧化碳35噸,同時降低能耗30%。此外,西部樞紐多為新建數據中心,無存量設備兼容約束,可直接采用定制化浸沒式方案,規避冷板式的局部熱點與功率上限問題。安徽蕪湖提爾液冷智算基地的實踐顯示,全浸沒方案可將計算密度提升10倍,同時帶動本土液冷設備產業鏈發展,形成“技術落地+產業賦能”的雙贏格局。
四、碳中和貢獻:從“節能降碳”到“全周期減碳”的差異
碳中和目標下,液冷方案的性價比不僅要計算經濟成本,更要考量碳減排效益。微軟團隊的生命周期評估(LCA)數據顯示,兩種方案的碳減排路徑存在顯著差異,且與能源結構深度綁定。
冷板式的碳減排核心在于“替代風冷節能”。相較傳統風冷,冷板式可減少15-16%的溫室氣體排放,降低15%能耗及31-50%用水。其優勢在于技術成熟、規模化應用成本低,可快速實現存量數據中心的碳減排改造,適合能源結構以火電為主的區域——通過降低能耗直接減少燃煤發電帶來的碳排放。但受限于風冷輔助的設計,其碳減排潛力存在天花板,難以滿足極致低碳場景的需求。
浸沒式的碳減排則實現了“節能+余熱回收+清潔能源適配”的三重收益。數據顯示,單相浸沒可降低13-16%溫室氣體排放,雙相浸沒更是提升至20-21%,用水減少48-82%,且當系統采用100%可再生能源時,節水效益可再提升13%-48%。在西部樞紐等可再生能源豐富的區域,浸沒式的超低PUE可最大化清潔能源的利用效率,配合高溫余熱回收用于區域供暖,實現“算力生產+民生供暖”的碳循環閉環。更重要的是,國產冷卻液技術的突破正在進一步降低其碳足跡——中石化“昆侖”系列、潞安太行煤基介電液等替代材料,不僅降低了對高GWP值氟化液的依賴,更實現了本土產業鏈的低碳化。
五、選型結論:場景導向下的“非此即彼”與“互補共生”
綜合來看,2025年液冷AIDC的選型并非“非此即彼”的二元對立,而是基于場景需求的精準匹配,甚至在高復雜場景下呈現“冷板式+浸沒式”的互補趨勢。
優先選擇冷板式的場景:1)東部存量數據中心升級改造,單機柜功率密度≤80kW,預算有限且需快速投產;2)中小型AI實驗室、政務數據中心等中低功率場景,缺乏專業維護團隊;3)工業中低功率設備散熱,需適配粉塵、振動等復雜環境。此類場景下,冷板式的兼容性、低成本與短周期優勢,可實現“性價比+碳減排”的平衡。
優先選擇浸沒式的場景:1)西部新建AI超算中心、大規模訓練集群,單機柜功率密度≥100kW;2)追求極致PUE(≤1.1)與長期碳減排目標,設備生命周期≥5年;3)高功率工業與軍工設備(新能源電池測試、軍工雷達等),對散熱穩定性要求嚴苛。此類場景下,浸沒式的高密適配、超低能耗與余熱回收優勢,可覆蓋前期高投入的成本溢價。
值得注意的是,混合散熱方案正在成為高復雜場景的新選擇——核心發熱部件(GPU集群)采用浸沒式保障極致散熱,輔助部件(內存、硬盤)采用冷板式控制成本。某AI訓練中心的實踐顯示,這種方案使單機柜功率密度達180kW,初期投入較純浸沒式降低30%,實現效率與成本的最優平衡。