人們對生成式 AI
充滿期待,從提升工作效率到推動科學研究的進步。然而,盡管這項技術的迅猛發展推動了強大模型在多個行業的快速應用,隨之而來的環境影響卻仍難以量化,更不用說有效緩解。
訓練擁有數十億參數的生成式 AI 模型,如 OpenAI 的
GPT-4,需要強大的計算能力,這不僅消耗大量電力,增加二氧化碳排放,還會給電網帶來額外壓力。
此外,將這些模型部署到實際應用中,使數百萬人能夠在日常生活中使用生成式 AI
模型,並在開發完成後持續微調以優化性能,這些都將長期消耗大量能源。
訓練、部署和微調生成式 AI 模型所使用的硬件依賴大量水資源進行冷卻,這可能對市政供水係統造成壓力,並影響當地生態係統。此外,生成式
AI 應用的激增推動了對高性能計算硬件的需求,從而在製造和運輸過程中間接增加了環境負擔。
“當我們討論生成式 AI
的環境影響時,不能隻是關注設備插上電源時消耗的電力。這些影響涉及更廣泛的係統層麵,並且會隨著我們采取的行動而持續存在。”麻省理工學院材料科學與工程係教授
Elsa A. Olivetti 表示。她同時也是麻省理工學院新氣候項目脫碳任務的負責人。
Olivetti 是論文“The Climate and Sustainability Implications of
Generative AI”的資深作者之一。該論文由 MIT 研究團隊共同撰寫,作為該研究所範圍內征集論文的一部分,旨在探討生成式
AI 對社會的變革潛力,包括其正麵與負麵影響。
高耗能的數據中心
數據中心的電力需求是生成式 AI 對環境影響的核心因素之一。這些中心承擔著訓練和運行深度學習模型的重任,為
ChatGPT、DALL-E 等廣受歡迎的 AI 工具提供支持。
數據中心是一種溫控建築,內部容納計算基礎設施,如服務器、數據存儲設備和網絡設備。例如,亞馬遜在全球運營著 100
多個數據中心,每個數據中心約包含 50,000 台服務器,用於支撐其龐大的雲計算服務。
盡管數據中心的概念自 20 世紀 40 年代以來就已存在(1945 年,賓夕法尼亞大學建造了全球首個數據中心,以支持首台通用數字計算機
ENIAC)。如今,生成式 AI 的崛起大幅加快了數據中心的建設速度。
“生成式 AI 的獨特之處在於其極高的功率密度。本質上,它仍然是計算,但一個用於訓練生成式 AI
的計算集群所消耗的能源可能是典型計算工作負載的七到八倍。”麻省理工學院計算機科學與人工智能實驗室博士後 Noman Bashir
解釋道。他同時是該研究論文的第一作者。
科學家估計,北美數據中心的電力需求已從 2022 年底的 2,688 兆瓦增長至 2023 年底的 5,341
兆瓦,其中部分增長歸因於生成式 AI 的需求。從全球來看,2022 年數據中心的總電力消耗達 460
太瓦時。根據經濟合作與發展組織的數據,這一能耗足以使數據中心成為全球第 11 大用電實體,位列沙特阿拉伯(371
太瓦時)和法國(463 太瓦時)之間。
預計到 2026 年,數據中心的電力消耗將接近 1,050 太瓦時,屆時它們將成為全球第五大用電實體,僅次於日本和俄羅斯。
盡管數據中心的計算任務並非全部涉及生成式 AI,但這一技術已成為能源需求增長的主要驅動力之一。
“新建數據中心的能源需求難以以可持續的方式滿足。各家公司建設數據中心的速度過快,這意味著其電力供應仍然主要依賴化石燃料發電廠。”
Bashir 指出。
訓練和部署大型 AI 模型,如?OpenAI?的 GPT-3 所需的電力難以精準估算。然而,2021
年的一項研究表明,穀歌和加州大學伯克利分校的科學家估算僅 GPT-3 的訓練過程就消耗了 1,287 兆瓦時的電力,這一用量足以支撐約
120 戶美國普通家庭一年的用電需求,並伴隨約 552 噸二氧化碳排放。
Bashir 解釋說,“盡管所有機器學習模型都需要經過訓練,但生成式 AI
麵臨的獨特挑戰之一在於其訓練過程的不同階段會導致能源消耗劇烈波動。”
電網運營商必須找到應對這些波動的方法以確保電網穩定性。然而,通常用於平衡電力負載的方法是使用柴油發電機,這不僅增加了對化石燃料的依賴,還進一步加劇了碳排放問題。
推理階段的能源影響持續增長
當一個生成式 AI 模型完成訓練後,其能源需求並不會隨之消失。
每次使用模型,例如用戶請求 ChatGPT 總結一封電子郵件,執行這些操作的計算硬件都會消耗能源。研究人員估計,一次 ChatGPT
查詢所消耗的電力大約是一次普通網絡搜索的五倍。
“但普通用戶不會過多考慮這一點。” Bashir 說道,“生成式 AI
界麵的便捷性,以及用戶對其環境影響缺乏認知,意味著我們不會去想如何減少對這項技術的使用。”
在傳統 AI 中,能源消耗相對均勻地分布在數據處理、模型訓練和推理三個階段。然而,Bashir 預計,生成式 AI
的推理階段未來將成為能源消耗的主導部分。隨著這些模型在越來越多的應用中普及,且未來版本的模型變得更大、更複雜,推理所需的電力消耗也將持續增加。
盡管數據中心的電力需求在研究中受到廣泛關注,但這些設施的水資源消耗同樣帶來了顯著的環境影響。
冷卻數據中心通常需要大量冷卻水來吸收計算設備產生的熱量。據 Bashir 估算,數據中心每消耗 1 千瓦時的能源,通常需要約 2
升水進行冷卻。這種高強度的水資源消耗可能加劇當地的水資源短缺,並對生態係統造成破壞。
“雲計算這個名稱並不意味著這些硬件真的存在於雲端。數據中心是現實世界中的實體設施,而它們的用水需求對生物多樣性有著直接和間接的影響。”
Bashir 說道。
數據中心內部的計算硬件本身也帶來了間接但顯著的環境影響。
盡管難以精確估算製造 GPU 所需的電力,但其能耗無疑高於更簡單的 CPU,因為 GPU 的製造工藝更加複雜。此外,GPU
的碳足跡還受到原材料運輸和供應鏈排放的疊加影響。
GPU
所使用的原材料開采過程同樣帶來了嚴重的環境影響。許多稀有金屬的開采涉及高汙染的采礦作業,並且在提煉過程中可能使用有毒化學品,對生態環境造成長期破壞。
市場研究公司 TechInsights 估計,2023 年,三大主要 GPU 生產商英偉達、AMD?和英特爾向數據中心出貨了 385
萬塊 GPU,較 2022 年的 267 萬塊大幅增長。預計 2024 年的增長幅度將更為顯著。
Bashir 指出,當前行業的發展路徑難以長期持續,但仍然可以通過推動負責任的生成式 AI 發展來支持環境目標。
他與 Olivetti 及其麻省理工學院的同事們認為,要實現這一目標,需要全麵考量生成式 AI
的環境與社會成本,同時深入評估其潛在收益的真正價值。
“我們需要一種更有針對性的方法,以係統且全麵地理解該領域新技術發展的影響。由於技術進步的速度如此之快,我們尚未有足夠的時間來完善衡量和理解這些權衡取舍的能力。”
Olivetti 總結道。