AI 大模型背后的驚人數字:問 ChatGPT 5 個問題,耗水 500 毫升?
作者 | 凌敏、核子可樂
ChatGPT 的爆火掀起了 AI 大模型熱潮,但科技進步始終是把雙面劍,AI 大模型帶來諸多便利的同時,也引發了人們關于能源消耗與環境污染的擔憂。此前,曾有研究稱訓練 GPT-3 的碳排放量等同于開車往返月球,也有研究稱訓練人工智能模型比長途飛行排放的碳要多得多。
能源消耗方面,構建大語言模型需要分析海量人類文章內容中蘊藏的模式,所有這些計算都要消耗大量電力并生成可觀的熱量。為了保持涼爽,數據中心需要泵水冷卻,并將其存儲在機房之外如倉庫般大小的冷卻塔中。
近日,外媒報道稱,微軟用于支持 OpenAI 的技術設施需要大量用水,這些水抽取自愛荷華州中部浣熊河和得梅因河的分水嶺處,被用于冷卻一臺強大的超級計算機。一份研究顯示,ChatGPT 這類 AI 大模型耗水量驚人:用戶每向 ChatGPT 提出 5-50 條提示詞或問題,ChatGPT 就會消耗掉 500 毫升的水。
問 ChatGPT 5-50 個問題,耗水 500 毫升
日前,微軟在其最新環境報告中透露,從 2021 年到 2022 年,公司全球設施用水量猛增了 34%(達到近 17 億加侖,相當于 2500 多個奧運會級別的賽級泳池)。這個數字遠遠高于幾年前外部研究人員的統計,而背后的驅動力量自然就是 AI 構建的需求。
對此,加州大學河濱分校研究員 Shaolei Ren 表示,“可以合理推斷,(用水量)大部分增長要歸功于 AI”,包括“對生成式 AI 的大量投入以及同 OpenAI 公司的合作。”
谷歌報告稱用水量同比增長了 20%,Ren 認為這很大程度上也源自 AI 研究需求。當然,谷歌的用水量增長并不均勻——其俄勒岡州基礎設施的用水量保持穩定,但拉斯維加斯周邊地區的用量則翻了一番。愛荷華州同樣成為用水大戶,谷歌在這里的康瑟爾布拉夫斯數據中心消耗的水資源比其他任何地方都要多。
在即將于今年晚些時候發表的論文中,Ren 研究團隊估計用戶每向 ChatGPT 提出 5-50 條提示詞或問題,ChatGPT 就會消耗掉 500 毫升的水(具體數字取決于基礎設施所在位置和季節氣候)。這一估算還未包含未經測量的間接用水,例如數據中心冷卻電力所對應的發電耗水。
Ren 表示,“大多數人并不清楚 ChatGPT 的資源消耗情況。但如果我們不了解資源用量,就沒辦法幫助節約資源?!?/p>
據了解,微軟于 2019 年向總部位于舊金山的 OpenAI 劃撥了首筆 10 億美元投資。隨后,OpenAI 正式發布了 ChatGPT。作為合作協議的一部分,微軟負責為 OpenAI 提供 AI 模型訓練所需要的算力。
為了踐行承諾,兩家公司紛紛將目光投向愛荷華州的西得梅因——十多年來,這座擁有 6.8 萬人口的市鎮一直是微軟的數據中心聚集地,負責為其云計算服務提供支持。微軟的第四和第五處數據中心將于今年晚些時候在這里開放。
據了解,一年中的大部分時間里,愛荷華州當地的氣候都相當涼爽,微軟可以直接利用室外空氣來保持超級計算機正常運行,并將產生的熱量直接排放出去。該公司在一份披露報告中表示,只有在溫度超過 29.3 攝氏度時,他們才需要切換為水冷模式。
但即便如此,當地設施在夏天的用水量仍然相當驚人。據西得梅因水廠介紹,2022 年 7 月,也就是 OpenAI 正式完成 GPT-4 訓練的前一個月,微軟向其愛荷華州數據中心集群泵入約 1150 萬加侖的水,約占該地區總用水量的 6%。
2022 年,該水廠的一份文件提到,除非微軟能夠“證明并落實能夠顯著降低峰值期用水量的技術”,否則該公司及當地政府將不再“考慮批準微軟未來的數據中心項目”。因為只有這樣,他們才能保障當地住宅和其他商業運營的供水需求。
微軟表示,他們正與水廠直接合作以解決對方反饋的問題。水廠方面則通過書面聲明指出,微軟一直是其良好合作伙伴,也始終在與當地官員合作,探討如何在滿足需求的同時減少水資源消耗。
大模型的碳排放量有多少?
除了能源消耗,ChatGPT 這類 AI 大模型的碳排放量也曾引發大眾擔憂。此前曾有計算機科學家稱,GPT-3 整個訓練周期的碳排放量,相當于開車到月球再返回地球;GPT-3 一輪訓練所消耗的電量,足以支撐丹麥 126 個普通家庭度過一整年。
做出這一猜測的專家來自丹麥哥本哈根大學,他們開發出名為 Carbontracker 的開源工具,用于預測 AI 算法的碳足跡。Carbontracker 估計,微軟數據中心內使用英偉達 GPU 構建的神經超級網絡運行功率約為 19 萬千瓦時,如果按照美國的平均碳排放水平計算,這將產生 8.5 萬公斤(85 噸)的二氧化碳,相當于 2017 年制造一輛新車所產生的排放量。這樣的排放量相當于車輛在歐洲行駛 80 萬公里,基本相當于開車到月球再返回地球的總行駛距離。
Carbontracker 的創造者之一、AI 電力消耗研究論文聯合作者 Lasse Wolff Anthony 認為,社區必須認真對待資源消耗問題。文章提到,從 2012 年到 2018 年之間,AI 研究的能源成本增長了約 30 萬倍。
Anthony 在采訪中表示,“二氧化碳估值是根據模型訓練期間,當地發電的平均碳排放量再加上運行模型的硬件總功耗所計算得出?!薄拔覀兺ㄟ^多個 API 來跟蹤碳排放強度。如果模型訓練所在地區沒有 API 可用時,我們則會默認取歐洲平均值,因為目前還沒有免費開放的全球監測數據。這些 API 會在訓練期間定期查詢硬件能耗,以準確估算總體碳足跡?!?/p>
當然,上述結果的前提是假設訓練 GPT-3 的數據中心完全依賴于化石燃料,這跟實際情況可能有所出入。
有分析認為,當前大模型的碳排放量可能被嚴重夸大。事實上,全球科技行業占總體溫氣體排放量的比例僅為 1.8%-3.9%,而其中又只有一小部分與 AI 相關。在規模層面,AI 的碳排放還遠無法與航空等其他主要碳源頭相提并論。相較于隨時運行的汽車和飛機,訓練 GPT 這類模型所對應的碳排放量絕對稱不上主要矛盾。
相較于隨時運行的汽車和飛機,訓練 GPT 這類模型所對應的碳排放量絕對稱不上主要矛盾。
誠然,目前我們并不清楚到底有多少大 AI 模型正在訓練當中,但如果只考慮 GPT-3 或其他規模更大的模型,那么此類模型成果總計還不到 1000 個。這里我們可以做個簡單計算:
最近一項評估認為,訓練 GPT-3 排放了 500 噸二氧化碳,Meta 的 Llama 模型則估計排放 173 噸。如果訓練 1000 個這樣的模型,那么總二氧化碳排放量約為 50 萬噸。2019 年,商業航空業排放了約 9.2 億噸二氧化碳,幾乎是大語言模型訓練的 2000 倍。而且要注意,這是一年的航空業運營對比多年來的大語言模型訓練。雖然后者的環境影響值得
當然,這里討論的還只是模型訓練階段。模型的運行和使用同樣要消耗電力并產生相關排放。根據一項分析,ChatGPT 運行一年可能會排放約 1.5 萬噸二氧化碳。但另一項分析結果則樂觀得多,認為約在 1400 噸左右。但無論取哪個數字,雖然沒有低到忽略不計的程度,但與航空業相比仍有幾個數量級的差距。
需要強調的是,問題的重點并不在于探索 GPT-3 這類大模型的碳足跡,而是希望引起人們對于訓練先進神經網絡所消耗的巨量資源的
目前,不少企業已開始重視能源消耗和環境污染問題,并在制定相應解決方案。微軟在一份聲明中稱,正在資助研究以測量 AI 開發所對應的能耗和碳足跡,“同時致力于提升大語言模型系統的訓練和應用效率。”
微軟表示,“我們將繼續監測自身排放、加快進展,同時更多使用清潔能源為數據中心供電、采購可再生能源,借此實現到 2030 年的碳負排放、水資源正循環和零浪費的可持續發展目標?!?/p>
OpenAI 也回應了這些評論,稱正“認真考慮”如何更好地運用寶貴算力。“我們意識到訓練大模型可能會消耗電力和水資源”,因此正在努力提高效率?!?/p>
需要建立透明的排放制度
隨著 AI 系統的不斷開發和應用,我們的確需要
首先,透明排放將至關重要。有了這種透明度保障,我們才能監控與 AI 模型訓練和使用相關的碳排放量,確保模型部署者和最終用戶能夠根據這些數字制定 AI 使用策略。此外,還應將 AI 相關排放納入溫室氣體清單與凈零目標,將此作為 AI 整體透明制度的組成部分。
法國最近就通過一項法律,要求電信企業提交關于其可持續發展的透明度報告。類似法律未來可能要求采用 AI 技術的產品向客戶報告其碳排放量,并要求模型提供商通過 API 開放碳排放數據。
更高的透明度將會帶來更強有力的激勵措施,借此建立起愈發節能的生成式 AI 系統,同時探索新的效率提升途徑。InfoQ 最近發表的一篇文章提到,微軟高級軟件工程師 Sara Bergman 呼吁人們
參考鏈接:
/uploads/pic/20231010/brzztrlrhyx data-track="40">https://www.infoq.com/articles/carbon-emissions-generative-ai/
https://www.theregister.com/2020/11/04/gpt3_carbon_footprint_estimate/
本文轉載來源:
https://www.infoq.cn/news/NuKxISZRb5sjg1lXgmeN
- 免責聲明
- 本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。 交易和投資涉及高風險,讀者在采取與本文內容相關的任何行動之前,請務必進行充分的盡職調查。最終的決策應該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產生的任何金錢損失負任何責任。