芯片工程師也要失業?谷歌AlphaChip入局AI設計
近日,谷歌DeepMind在Nature上正式公布了其最新的芯片設計算法AlphaChip,該方法致力于加速和優化計算機芯片的開發,已經歷經多款TPU的產品考驗,可在短短數小時內完成人類專家需要數周甚至數月的芯片布局設計。
雖然近年來各大EDA公司都在積極將AI引入到自己的芯片設計工具當中,但是早在2020年,谷歌發表了一篇具有里程碑意義、題為《Chip Placement with Deep Reinforcement Learning》預印本論文,首次向世界展示了其采用新型強化學習方法設計的芯片布局。隨后在2021年,谷歌又在Nature上發表了論文并將其開源了。
2022年,谷歌進一步開源了該論文中描述的算法代碼,使得全球的研究人員都能夠利用這一資源對芯片塊進行預訓練。
如今,這一由AI驅動的學習方法已經經歷了TPU v5e、TPU v5p和Trillium等多代產品的考驗,并在谷歌內部取得了顯著成就。更令人矚目的是,谷歌DeepMind團隊最近在Nature上發表了該方法的附錄,詳細介紹了其用于芯片設計布局的強化學習方法,并將該模型命名為“AlphaChip”。據稱AlphaChip有望大大加快芯片布局規劃的設計,并使它們在性能、功耗和面積方面更加優化。目前AlphaChip已發布在Github上與公眾共享,同時谷歌還開放了一個在20個TPU模塊上預訓練的檢查點。
谷歌TPU發展歷程
據介紹,AlphaChip在設計谷歌的張量處理單元(TPU) 方面發揮了重要作用,并已被包括聯發科(MediaTek)在內的其他公司采用。同時,谷歌還開放了一個基于20個TPU模塊預訓練的檢查點,分享了模型權重。
谷歌首席科學家Jeff Dean表示,開放預訓練AlphaChip模型檢查點以后,外部用戶可以更容易地使用AlphaChip來啟動自己的芯片設計。
AlphaChip的問世,不僅預示著AI在芯片設計領域的應用將變得更加廣泛,也標志著我們正邁向一個由“芯片設計芯片”的全新時代。
從數月縮短至數小時
通常芯片設計布局或平面圖是芯片開發中時間最長、勞動強度最高的階段。近年來,EDA三巨頭之一新思科技(Synopsys)開發了AI輔助芯片設計工具,可以加速開發并優化芯片的布局規劃。但是,這些工具非常昂貴。谷歌希望在一定程度上使這種AI輔助芯片設計方法大眾化。
如今,如果由人類來為GPU等復雜芯片設計平面圖大約需要24個月。不太復雜的芯片的平面規劃可能也至少需要幾個月的時間,而這意味著數百萬美元的成本,因為維持一個設計團隊通常需要一大筆費用。
谷歌表示,AlphaChip加快了這一時間表,可以在短短幾個小時內創建芯片布局。此外,據說它的設計非常出色,因為它們優化了電源效率和性能。谷歌還展示了一張圖表,顯示與人類開發人員相比,各種版本的 TPU 和 Trillium 的平均線長(wirelength)都有所減少。
上圖展示了AlphaChip在三代Google張量處理單元 (TPU) 中的平均線長(wirelength)減少量,并與TPU物理設計團隊生成的位置進行了比較
作為谷歌DeepMind的巔峰之作,AlphaChip正以其在芯片設計領域的革命性進展,捕獲全球科技界的矚目。
芯片設計是一項位于現代科技之巔的領域,其復雜性在于將無數精密元件通過極其細微的導線巧妙連接。作為首批應用于解決現實世界工程問題的強化學習技術之一,AlphaChip能夠在短短數小時內完成與人類相媲美甚至更優的芯片布局設計,無需耗費數周或數月的人力勞動。這一劃時代的進展,為我們打開了超越傳統極限的想象之門。
AlphaChip是如何工作的?
芯片設計難度極大,部分原因在于計算機芯片由許多相互連接的塊組成,這些塊具有多層電路元件,所有元件都通過極細的導線連接。此外,芯片還有很多復雜且相互交織的設計約束,設計時必須同時滿足所有約束。由于這些復雜性,芯片設計師們在 60 多年來一直在努力實現芯片布局規劃過程的自動化。
與AlphaGo和AlphaZero類似,谷歌構建AlphaChip時,也將芯片的布局規劃視為一種博弈。
AlphaChip的秘訣在于其采用的強化學習原理,將芯片布局設計視為一場游戲。從一個空白的網格出發,AlphaChip一次放置一個電路元件,直至全部就位。隨后,根據布局的優劣,系統會給予相應的獎勵。
更重要的是,谷歌創新性地提出了一種“基于邊”的圖神經網絡,使得AlphaChip能夠學習芯片元件之間的相互關系,并將其應用于整個芯片的設計中,從而在每一次設計中實現自我超越。與AlphaGo類似,AlphaChip可以通過「游戲」學習,掌握設計卓越芯片布局的藝術。
左圖:AlphaChip在沒有任何經驗的情況下放置開源處理器Ariane RISC-V CPU的電路元件;右圖:AlphaChip在對20個TPU相關設計進行練習后放置相同的電路元件
在設計TPU布局的具體過程中,AlphaChip首先會在前幾代芯片的各類模塊上進行預訓練,包括芯片上和芯片間的網絡模塊、內存控制器和數據傳輸緩沖區等。這一預訓練階段為AlphaChip提供了豐富的經驗。隨后,谷歌利用AlphaChip為當前TPU模塊生成高質量的布局。
與傳統方法不同,AlphaChip通過解決更多的芯片布局任務,不斷優化自身,如同人類專家不斷通過實踐提升技能一樣。正如DeepMind聯合創始人兼CEO Demis Hassabis所言,谷歌已經圍繞AlphaChip建立了一個強大的反饋循環:首先,訓練先進的芯片設計模型 (AlphaChip);其次,使用AlphaChip設計更優秀的AI芯片;然后,利用這些AI芯片訓練更出色的模型;最后,利用這些模型再去設計更出色的芯片。
如此反復,實現了模型與AI芯片的同步升級,Demis Hassabis表示,“這正是谷歌TPU堆棧表現如此好的部分原因。”
谷歌TPU及聯發科均已采用
自2020年以來,AlphaChip一直被用于設計谷歌自己的TPU AI加速器,這些加速器驅動著谷歌的許多大規模AI模型和云服務。這些處理器運行基于Transformer的模型,為谷歌的Gemini和Imagen提供支持。
為了設計TPU布局,AlphaChip首先在前幾代的各種芯片塊上進行練習,例如片上和芯片間網絡塊、內存控制器和數據傳輸緩沖區。這個過程稱為預訓練。然后谷歌在當前的TPU塊上運行AlphaChip以生成高質量的布局。與之前的方法不同,AlphaChip解決了更多芯片布局任務實例,因此變得更好、更快,就像人類專家所做的那樣。
到目前為止,AlphaChip已被用于開發各種處理器,包括谷歌的TPU和聯發科旗艦級天璣5G SoC芯片,這些處理器廣泛用于各種智能手機。此外,還包括谷歌首款基于Arm的通用數據中心CPU Axion。因此,AlphaChip能夠在不同類型的處理器中進行泛化。
可以說AlphaChip改進了每一代TPU的設計,包括最新的第6代Trillium芯片,確保了更高的性能和更快的開發。盡管如此,谷歌和聯發科目前仍都只是依賴AlphaChip來制作芯片當中有限的一些區塊,而人類開發人員仍然承擔了大部分的設計工作。不過,隨著持續AlphaChip的持續迭代,其所承擔的區塊也越來越多,已經從TPU v5e的10個區塊提升到了Trillium的25個區塊。
谷歌最近三代張量處理單元 (TPU)(包括v5e、v5p和Trillium)中AlphaChip設計的芯片塊的數量
谷歌表示,AlphaChip已經在各種芯片模塊上進行了預訓練,這使得AlphaChip能夠在實踐更多設計時生成越來越高效的設計布局。雖然人類專家可以學習,而且許多人學得很快,但機器的學習速度要高出幾個數量級。與人類專家相比,AlphaChip不僅放置的模塊數量更多,而且布線長度也大大減少。隨著每一代新TPU的推出,AlphaChip設計出了更優秀的芯片布局,提供了更完善的整體平面圖,從而縮短了設計周期并提升了芯片性能。
擴展AI在芯片開發中的應用,探索全流程自動化
AI在芯片設計領域的深度介入,引發了一個大膽的設想:我們能否用AI設計一顆完整的芯片?事實上,英偉達已經在這一領域進行了嘗試。通過深度強化學習代理設計電路,英偉達的H100中就有近13,000條電路由AI設計。中國科學院計算所也利用AI在5小時內生成了一個名為“啟蒙一號”的RISC-V處理器芯片,擁有400萬個邏輯門,性能與Intel 80486相當。
谷歌表示,AlphaChip的成功激發了一波新的研究浪潮,將人工智能用于芯片設計的不同階段。這包括將AI技術擴展到邏輯綜合、宏選擇和時序優化等領域,Synopsys和Cadence已經提供了這些技術,盡管需要很多錢。據谷歌稱,研究人員還在探索如何將AlphaChip的方法應用于芯片開發的更進一步階段。
“AlphaChip激發了芯片設計強化學習的全新研究路線,跨越了從邏輯綜合到布局規劃、時序優化等的設計流程,”谷歌的一份聲明中寫道。
展望未來,谷歌看到了AlphaChip徹底改變整個芯片設計生命周期的潛力:從架構設計到布局再到制造,人工智能驅動的優化可能會帶來更快的芯片、更小(即更便宜)和更節能的芯片。雖然目前谷歌的服務器和基于聯發科天璣5G的智能手機受益于AlphaChip,但未來應用程序可能會擴展到幾乎所有領域。
AlphaChip的未來版本已經在開發中,因此或許未來在AI的驅動下,芯片設計將會變得更加的簡單。在不斷的研究和迭代中,AlphaChip有望覆蓋芯片設計的每一個階段,從架構設計到制造工藝。這樣的技術發展將為行業帶來更多機會,同時也為工程師和開發者們提供了全新的工具,使得芯片設計的門檻不斷降低,鼓勵更多創新的涌現。
當前,AI設計完整芯片的能力依然有限,但這無疑是未來芯片發展的一個重要機遇。隨著技術的不斷進步,AI在芯片設計領域的潛力必將得到進一步挖掘和利用,并最終改變整個芯片的設計過程。
(文章來源:財中社)
- 免責聲明
- 本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。 交易和投資涉及高風險,讀者在采取與本文內容相關的任何行動之前,請務必進行充分的盡職調查。最終的決策應該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產生的任何金錢損失負任何責任。