開放生態才是英特爾切走生成式AI蛋糕的利器
英特爾本周召開了年度Intel Vision大會,大部分人會首先被比英偉達H100訓練性能高70%,推理性能高50%,能效高40%,擁有TCO(總體擁有成本)的Gaudi 3吸引。
英特爾CEO帕特·基辛格發布Gaudi 3的時候也開心地跟隨現場伴奏搖晃起身體。
相比之下,Intel Vision上英特爾宣布將創建一個開放平臺助力企業推動AI創新很容易被忽略。
但這才是英特爾在生成式AI時代分走蛋糕最有效的利器,只有擁有開放且繁榮的生態,至強6、Gaudi3、酷睿Ultra、英特爾AI網絡連接卡才更容易備受青睞。
為什么開放生態是利器?
所有人都在說CUDA生態才是英偉達在AI領域里最強的護城河,這是英偉達耗費近20年建立的龐大生態。
可是現在大多數程序員都在AI框架級別或者更高級別進行編程,使用CUDA進行低級編程已經不那么普遍。
這就意味著,英偉達的軟件生態護城河已經不像原來那樣堅不可摧。開放生態是一個追趕甚至超越英偉達的機會。
“傳統模式中,幾家領導公司組建一個開放聯盟,各自有明確的分工,那時更多是一個選擇問題。”英特爾公司副總裁、英特爾中國軟件和先進技術事業部總經理李映說,“這一次基于AI大模型的變化,是第一次出現開放、開源和整個行業或者說和技術創新的爆發點結合在一起。現在開放、開源和閉源同時出現的時候,不是選擇,而是自然演變、發展的過程。”
開放、開源的生態,將會對AI未來發展起到非常重要作用的趨勢已經非常明顯。
這也讓所有人看到,區別于以往一個開放平臺或者聯盟成立的時候只有幾家聯盟成員,英特爾聯合Anyscale、Articul8、DataStax、Domino、Hugging Face、KX Systems、MariaDB、MinIO、Qdrant、RedHat、Redis、SAP、VMware、Yellowbrick和Zilliz共同宣布,將創建的開放平臺宣布之時就有大量聯盟成員。
英特爾院士、大數據技術全球首席技術官、大數據分析和人工智能創新院院長戴金權指出,“一個開放的生態,可以讓同一個生態系統中的創新相互促進。并且在同一生態里的新應用場景可以互通。”
英特爾要構建一個什么樣的AI開放生態?Intel Vision上基辛格給出的答案是企業AI。
根據cnvrg.io的調研結果,2023年,有10%的企業成功將其生成式AI項目產品化。Gartner預計,2026年80%的企業將使用生成式AI。
這樣看來企業AI是一個確定性很高且潛力巨大的市場。
為企業AI構建開放的生態,需要包含三個方面:開放的軟件堆棧、開放的平臺、英特爾開發者云平臺。這也是一層層突破英偉達強大的AI生態壁壘。
“我們推出的開放聯盟去搭建面向企業AI的開放平臺,能夠真正的幫助各個不同的RAG(檢索增強生成)組件中實現互聯互通,能夠實現共同的努力,去構建架構藍圖這種的,保證在企業AI當中,有一個整體的可工作的框架。”李映同時表示,
“英特爾開發者云平臺不僅能幫助開發者最早接觸到英特爾最新的硬件,更重要的是能夠保證各種開源框架、組件在一個環境中,能夠保證這種框架之間的兼容性,開發者能夠擁有更好的用戶體驗,提升開發效率。”
RAG對于企業AI來說至關重要。因為目前AI模型比較通用,企業的數據與這些AI模型不太相關,把企業的隱私數據和通用的模型結合在一起就變成了一個很大的挑戰。
“很多人都非常堅定RAG可以解決企業的數據知識增強的問題。因為有一個開放的生態系統,有一個類似的實施標準的平臺,就很容易把數據中心級別的RAG系統運行在企業的AIPC上,可以變成一個個人知識庫。”戴金權說。
英特爾公司市場營銷集團副總裁、中國區云與行業解決方案部總經理梁雅莉就說,對于企業AI而言,開放、易部署、可擴展、可靠非常重要。
英特爾AI的最新全景圖
構建開放、繁榮的AI生態,是英特爾分走AI蛋糕,需要與眾多生態合作伙伴一起努力的方向。
藏開英特爾企業AI生態之下的,就是英特爾完整的AI生態全景圖,包含了至強6、Gaudi3、酷睿Ultra、英特爾AI網絡連接卡在內的一系列硬件及oneAPI等軟件產品。
Intel Vision上英特爾展示的硬實力,最受關注是Gaudi3,直接看數據,相比上一代Gaudi 2,Gaudi 3在BF16精度下可提供4倍的AI計算能力、1.5倍的內存帶寬、2倍的網絡帶寬,支持大規模系統橫向擴展,最多可擴展至8192個芯片的參考架構。
對比英偉達H100,訓練Llama 7B、13B以及GPT-3 175B模型,Gaudi3速度比H100快40%~70%。
推理Llama 7B、70B以及Falcon 180B模型,速度比H100快50%,能效提高40%,在較長輸入和輸出序列上的推理性能優勢更大。比H200也有30%的速度優勢。
相比英偉達的GPU,英特爾Gaudi提出了TCO的優勢,這是Gaudi3打動客戶的重要特性。
除了專用的AI加速器,英特爾的另一個殺手锏是至強處理器。
去年生成式AI更關注模型的訓練,對成本和功耗沒那么重視,企業都希望訓練一個自己的通用大模型。
“今年企業的關注重點轉到了推理。對企業來說,大模型訓練出來是需要推理變現且能夠盈利。”英特爾公司市場營銷集團副總裁、中國區數據中心銷售總經理、中國區運營商銷售總經理莊秉翰說,“目前的利潤大多基于通用數據中心的應用,尤其是現在CPU的迭代非常迅速,每一代CPU又會帶來新的性能提升和能耗減少。”
英特爾為面向數據中心、云和邊緣的下一代處理器進行了品牌煥新,即英特爾至強6。
“至強6全新的簡潔品牌則是一個產品組合,可以解決數據中心在性能、功耗,以及多元工作負載等方面的各種問題。”莊秉翰介紹,配備能效核(E-cores)的英特爾至強6處理器將于2024年第二季度推出,提供卓越的效率,配備性能核(P-cores)的英特爾至強6處理器將緊隨其后推出,帶來更高的AI性能。
能效核的英特爾至強6處理器(代號為Sierra Forest),與第二代英特爾至強處理器相比,每瓦性能提高2.4倍,機架密度提高2.7倍。客戶能以近3:1的比例替換舊系統,大幅降低能耗,實現可持續發展目標。
性能核的英特爾至強6處理器(代號為Granite Rapids),包含了對MXFP4數據格式的軟件支持,與使用FP16的第四代英特爾至強處理器相比,可將下一個令牌(token)的延遲時間最多縮短6.5倍,能夠運行700億參數的Llama-2模型。
“對企業來說,大模型也處在初始階段,不需要立即部署一個很大的GPU集群,這對于運維和開發來說都是很大的挑戰。如果采用逐步部署生成式AI的節奏,可以通過CPU先做一些應用部署。”莊秉翰指出。
在邊緣端,英特爾發布了涵蓋英特爾酷睿Ultra、英特爾酷睿、英特爾凌動處理器和英特爾銳炫顯卡系列產品在內的全新邊緣芯片,主要面向零售、工業制造和醫療等關鍵領域。英特爾邊緣AI產品組合內的所有新品將于本季度上市,并將在今年年內獲得英特爾Tiber邊緣平臺的支持。
在客戶端的AI PC,英特爾展示了即將推出的產品。包括將于2024年推出的下一代英特爾酷睿Ultra客戶端處理器家族(代號Lunar Lake),將具備超過100 TOPS平臺算力,其中神經網絡處理單元(NPU)將有超過46 TOPS的算力。
在AI全景圖里,還有互聯產品。
英特爾中國網絡與邊緣事業部首席技術官、英特爾高級首席AI工程師張宇說,“現在的AI系統還是采用馮諾依曼的架構,這個系統不僅要看它的算能,還要看它數據傳輸的能力。”
通過超以太網聯盟(UEC),英特爾正在驅動面向AI高速互聯技術(AI Fabrics)的開放式以太網網絡創新,并推出一系列針對AI優化的以太網解決方案。
英特爾的產品組合包括英特爾AI網絡連接卡(AI NIC)、集成到XPU的AI連接芯粒、基于Gaudi加速器的系統,以及一系列面向英特爾代工的AI互聯軟硬件參考設計。
從客戶端到邊緣端再到云端的推理和訓練,再加上網絡和軟件,英特爾展示了最新的AI全景圖,最重要的是英特爾宣布組建開放的企業AI生態,這才是英特爾能用強大的硬件在AI市場分到蛋糕的關鍵。
并且,英特爾在生成式AI從訓練轉向推理的關鍵節點,選擇企業AI這一對生成式AI更有付費能力的市場構建開放生態,在恰當的時間點選擇了正確的戰略。
接下來就是英特爾的執行力以及生成式AI能否幫助企業盈利的問題。
- 免責聲明
- 本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。 交易和投資涉及高風險,讀者在采取與本文內容相關的任何行動之前,請務必進行充分的盡職調查。最終的決策應該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產生的任何金錢損失負任何責任。