ADVERTISEMENT
自從 ChatGPT 在 2022 年推出後,數據中心的爆炸性增長使這些耗能設施的環境影響成為焦點。
然而,我們不僅需要關注能源的使用,這些設施也可能消耗大量的水資源。
德州戰略熱能實驗室(Strategic Thermal Labs)的奧斯汀.謝爾納特(Austin Shelnutt)在今年秋季於亞特蘭大舉行的SC24會議中發表簡報指出,在美國,資料中心每天的用水量可能介於三十萬到四百萬加侖之間,才能保持內部運算設備的冷卻。
ADVERTISEMENT
我們稍後會再說明為何有些資料中心的用水量比其他資料中心更多,但在某些地區,資料中心的用水量高達該地區供水量的百分之二十五。
可以理解的是,這種程度的用水量引發了人們對水資源短缺和沙漠化的擔憂,而這些問題原本就因為氣候變遷而存在,生成式人工智慧的普及更使情況雪上加霜。如今,用於訓練這些模型的人工智慧資料中心通常需要數萬個GPU,每個GPU都能產生 1,200 瓦的功率和熱量。
然而,未來幾年內,超大規模數據中心、雲端服務提供商以及模型開發商計劃部署數百萬顆 GPU 和其他 AI 加速器,這需要千兆瓦級的能源,這也意味著水資源消耗將進一步增加。
ADVERTISEMENT
根據加州大學河濱分校和德州大學阿靈頓分校的研究人員的說法,到2027年,全球人工智慧需求每年可能導致42億到66億立方公尺的水資源消耗。這大約相當於英國一年用水量的一半。
然而,要減少資料中心的用水量,並不像捨棄蒸發式冷卻塔、改用無水替代方案那麼簡單。
資料中心的水循環
資料中心透過幾種方式消耗水資源。其中之一是直接水資源消耗,這是我們將主要關注的部分。這些水資源來自當地水源,包括自來水和廢水處理廠。
ADVERTISEMENT
這些水被泵入冷卻塔,在冷卻塔中蒸發,將熱量傳遞到空氣中。如果你曾經使用過水冷式冷氣來為你的家或公寓降溫,冷卻塔的工作原理也類似。
蒸發式冷卻在資料中心營運商中很受歡迎,主要有幾個原因,但最主要的原因是它們非常擅長散熱,而且不需要消耗大量電力。
根據謝爾納特的說法,每分鐘蒸發 10 加侖的水足以冷卻大約 1.5 兆瓦的運算設備。
ADVERTISEMENT
當我們談論「消耗」時,指的是被蒸發的水資源。它並未真正被消耗,而是透過氣流從當地水系統中移除。這在乾旱氣候中可能成為問題,因為蒸發冷卻在這些水資源匱乏的地區效果最佳。
根據研究人員的說法,進入冷卻塔的水中,實際上大約有百分之七十到八十被消耗掉了,其餘的水則是用於沖洗掉類似於清潔加濕器時會發現的礦物質沉積物。剩下的鹽水會在系統中循環利用,直到其濃度超過一定程度,此時就會將其排放到現場或由當地市政當局營運的蓄水池或處理廠,然後再返回當地水系統。
要使這一過程順利運行,廢水處理廠需要具有足夠的規模來處理數據中心產生的鹽水量及其濃度。如果處理設施規模不夠,問題就會變得非常複雜,就像微軟在亞利桑那州古德伊爾(Goodyear)的數據中心曾遇到的情況那樣。
為什麼資料中心的「飲水習慣」難以戒除
資料中心營運商之所以偏愛蒸發式冷卻器,原因之一是它們的營運成本比替代技術便宜得多。
謝爾納特表示:「無論使用何種冷卻介質,蒸發水的性能係數(COP)總是更高,這意味著需要的能量更少。」
他解釋說,事實上,蒸發式冷卻的COP(指每單位功率移除的熱量)為 1,230,而乾式冷卻器和冷水機的COP分別約為12和4。
就能源消耗而言,這使得採用蒸發式冷卻的資料中心比不消耗水的資料中心更節能,這也意味著更低的營運成本。
然而,並非所有地點和氣候都適合蒸發冷卻。在水資源匱乏的炎熱氣候地區,或者蒸發冷卻器無效的高濕度地區,可能會使用類似於空調系統的冷卻器。
在北歐等較涼爽的氣候中,資料中心通常會利用自然冷卻和乾式冷卻器,這些冷卻器利用較低的環境氣溫將熱量排放到大氣中,而不會消耗任何水。
數位不動產(Digital Realty)技術長克里斯·夏普(Chris Sharp)告訴說r,是否使用蒸發式冷卻很大程度上取決於地點和氣候。
「我們必須理解,水是一種稀缺資源,」他解釋道。「每個人都必須從這個基點出發,確保對這種資源的有效利用。」
這家共置巨頭在全球營運著三百多個資料中心,並根據預測的容量需求和環境因素採用各種設計。克里斯·夏普表示,該公司標準的資料中心設計根本不消耗任何水,而是依靠冷水機從設施中帶走能量。然而,在某些地區,則會採用蒸發式冷卻和乾式冷卻器。
大部分資料中心用水並非在現場消耗
雖然乾式冷卻器和冷水機可能不會在現場消耗水,但它們並非沒有缺點。這些技術消耗了來自當地電網的大量電力,並可能導致更高的間接用水量。。
根據美國能源資訊署(US Energy Information Administration)的資料,美國約有 89% 的電力來自天然氣、核能和燃煤發電廠。許多這些發電廠使用蒸汽渦輪來發電,而這個過程需要消耗大量的水。
諷刺的是,雖然蒸發式冷卻器是資料中心消耗大量現場用水的原因,但同樣的技術也常用於減少蒸汽帶走的水量。儘管如此,透過能源生產消耗的水量還是遠遠超過現代資料中心的用水量。
根據勞倫斯伯克利國家實驗室(Lawrence Berkeley National Lab, LBL)於 2016 年進行的一項研究,大約 83% 的資料中心用水量可歸因於發電。因此,若以增加電力消耗為代價來減少現場用水,可能會導致總用水量的增加。
然而,加州大學河濱分校電機和計算機工程副教授任紹磊(Shaolei Ren)告訴說,發電廠的用水量可能比資料中心多,並不意味著它們取用的是相同的水源,並補充說許多發電廠的水源來自河流和湖泊等可能不適合資料中心的水源。
任紹磊(Ren)和他的團隊一直在研究資料中心對用水量和空氣品質的環境影響。
同樣地,這也高度取決於地點和電網組合。例如,位於水力發電、太陽能或風力發電豐富地區的資料中心的間接用水量將低於以化石燃料或燃燒發電的資料中心。
可以採取哪些措施來抑制資料中心的用水量?
我們知道,除了少數例外情況,資料中心總是會使用一定量的水,但營運商仍然有很多方法可以減少直接和間接的用水量。
最顯而易見的一種方法是根據設施負載匹配水流速率,並在可能的情況下利用自然冷卻。Digital Realty 的首席技術長克里斯·夏普表示,透過結合感測器與軟體自動化技術來監控使用蒸發式冷卻的設施中的泵和過濾器,公司已觀察到整體用水量減少了 15%。
他說:「這相當於系統減少了約 1.26 億加侖的水抽取量,因為我們運行得更加高效。」
此外,我們看到許多資料中心建造於較冷的氣候地區,這些地區大部分時間可以利用自然冷卻。更好的是,在許多北歐國家,大量的水力發電意味著即使需要輔助乾冷器或冷水機組,間接用水量也不成問題。
我們也看到資料中心產生的熱量被用於為當地辦公室供暖、支援區域供熱網路,甚至是為溫室供暖,以便全年生產農產品。
將 AI 群組切換至直接晶片冷卻
在不適合自然冷卻和熱量再利用的地區,將人工智慧叢集的冷卻方式轉為直接晶片和浸沒式液體冷卻(DLC)(順便一提,這是一個不真正消耗水的封閉迴路),可以促進乾式冷卻器的使用。雖然乾冷器的能耗仍高於蒸發式冷卻器,但液冷技術顯著降低的電源使用效率(Power Use Effectiveness, PUE)可能會彌補這一差距。
如果你不熟悉PUE,它指的是資料中心消耗的電力中有多少用於運算、儲存或網路設備(即能創造收益的設備),而非冷卻設施等無法產生收益的用途。PUE 越接近 1.0,設施的效率就越高。
這一點尤其因為空氣冷卻的 AI 系統中,約 20% 的能耗用於機殼風扇。此外,水的導熱性能遠高於空氣。切換至 DLC(例如 Nvidia 的高規 Blackwell 部分已開始應用這項技術),有可能將 PUE 從 1.69-1.44 降至約 1.1 或更低。
然而,正如謝爾納特在他的SC24簡報中指出的那樣,這種平衡很大程度上取決於DLC節省的電力是否會被重新分配以支援額外的運算。
水資源感知運算
雖然許多這些節水技術都需要改變設施基礎設施才能實施,但另一種方法可能是改變工作負載在資料中心之間的分配方式。
任紹磊解釋說,
這個想法與碳資源意識運算(Carbon-Aware Computing)類似,將工作負載根據電網碳強度和時間進行分配。「基於水資源壓力等實時效率調整,也是可以做到的。畢竟,不同時間的蒸發率會有變化,例如中午與晚上相比。」
他承認,雲端服務供應商和超大規模運算提供者可能更容易實現這一點,因為他們對基礎設施的編排有更大的控制權。「相較之下,共用主機服務商受限於伺服器與工作負載的有限控制,面臨更多挑戰。」
這種方法也可能不適用於對延遲敏感的工作負載,例如人工智慧推論,因為接近使用者對於即時資料處理至關重要。然而,像人工智慧訓練之類的工作負載沒有這些限制。可以想像,一個可能需要執行數週或數月的人工智慧訓練工作負載,可以排隊在位於極地地區的偏遠資料中心中執行,該資料中心可以利用自然冷卻。
微調工作負載(涉及改變預先訓練模型的行為)的運算密集度要低得多。根據基礎模型和所用資料集的大小,微調作業可能只需要幾個小時即可完成。在這種情況下,可以將作業安排在夜間溫度較低且蒸發掉的水較少時執行。
水會成為新的石油嗎?
雖然資料中心的用水量仍然是一個令人擔憂的問題,尤其是在乾旱易發地區,但謝爾納特認為更大的問題是這些設施使用的水來自哪裡。
「地球上並不缺水。地球上缺乏的是某些地區的可飲用水,以及在部分地區存在的水分配短缺問題,」他說。
為解決這些問題,謝爾納特建議資料中心營運商應該投資海水淡化廠、配水網路、內部汙水處理設施和非飲用水儲存設施,以支援更廣泛地採用蒸發式冷卻器。
雖然先淡化海水,然後透過管道或火車運輸的想法聽起來成本高昂,但許多超大規模運算提供者已承諾在未來幾年內投入數億美元於場內核能供應。因此,投資於水的淡化與運輸或許並非天方夜譚。
更重要的是,謝爾納特聲稱,從海岸淡化和運輸水的效率仍然高於使用乾式冷卻器或基於冷媒的冷卻技術。
「目前海水淡化每立方公尺耗能 3 千瓦時——這是過去十年的平均值;許多海水淡化設施已將能耗降至每立方公尺 1 千瓦時以下——這相當於 222 的性能係數(COP),」他說。
經由管道運輸 1,000 英里後,COP 降至 132。若用火車運輸,COP 進一步降至 38。這雖然遠低於來自市政處理廠的蒸發式冷卻用水,但仍比乾冷器高效得多。
ADVERTISEMENT