AI大模型加速落地,阿里云持續「滋養」
在剛剛結束的2024云棲大會上,小鵬汽車董事長、CEO何小鵬駕駛著小鵬P7+緩緩駛入會場,吸引了眾多觀眾的關注。據了解,這是全球首款AI汽車,搭載了最新的端到端的自動駕駛技術,能夠在無圖情況下實現全城智能駕駛,并且每兩天就能進行一次升級。
何小鵬表示:“對于最普通的用戶,從現在到未來的36個月,可以讓我們每一個人在每一個城市都像老司機一樣開車。”
這些是用戶能夠感知到的。
小鵬汽車為何能率先推出首款AI汽車?其背后離不開大量算力支持。據了解,兩年前,小鵬汽車與阿里云在烏蘭察布共同建立了中國最大的自動駕駛AI算力中心,該中心成立后,將自動駕駛模型訓練效率提升了超600倍,與此同時這兩年該中心算力規模已經提升了四倍,達到了2.51 Eflops,在車企里是TOP級別。
小鵬汽車自動駕駛負責人李力耘則更進一步指出,端到端對于自動駕駛只是開局,真正的競賽正在云端展開。
這些是用戶不能夠感知到的。
無論感知到還是不能感知到,一場大模型為代表的AI驅動的變革,正以前所未有的光度和深度在展開。
大模型要落地,是一項系統工程小鵬汽車在自動駕駛領域的狂飆突進是大模型展現生產力的顯著例子。
一方面讓我們看到,隨著大模型與千行百業發生關聯, AI計算正在加速演進,成為整個計算體系的主導。另一方面也充分證明,大模型要想真正落地并發揮效能,不僅僅是模型的訓練和推理,而是一項涉及多個環節的系統性工程,需要AI基礎設施的支持。
阿里巴巴集團CEO、阿里云智能集團董事長兼CEO吳泳銘在2024云棲大會上表示,在新增算力市場上,超過50%的新需求由AI驅動產生,AI算力需求已經占據主流地位,且該趨勢還會持續擴大。
據相關數據顯示,當前,行業前沿模型訓練計算量每年增長4~5倍,中國AI算力規模2022~2027年復合增長率高達33.9%;模型參數以10倍速增長,模型數據集以50倍速增長,對存力也提出了更高需求。
Pascal的發明人曾經寫過一句話:一個嬰兒的速度的1000倍就是一架噴氣機——而當任何的事情的規模增加了1000倍,它就會發生天翻地覆的變化。“這個時候一定要引入了新的東西,不然它沒法解決了。”中國工程院院士、之江實驗室主任、阿里云創始人王堅在前不久的外灘大會上這樣說道。
引入什么新東西?那就是AI基礎設施。
在歷史的長河中,那些至關重要的創新最終往往融入并成為基礎設施的一部分,如工業時代的電力。AI時代的云計算也正是如此,據紅杉資本的研討會資料顯示,云計算如今已是基礎設施的核心,英偉達等公司也被劃分到了基礎設施類別中。
為何云計算會被認為是AI時代的基礎設施?
阿里云智能集團資深副總裁、阿里云公共云事業部總裁劉偉光,在云棲大會上給出了他的答案:
“今天云的分布式架構能力、全球部署能力、全球一張網的高速通信能力,以及高性能的存儲和網絡處理能力,以及節能、綠色環保能力,服務器使用效率等等,相比傳統企業架構,是更適合為 AI 應用爆發和迭代提供非常有力的全方位支撐。”
當然,眼下也有一些企業自己選擇自建IDC買幾十臺、上百臺 GPU 推理訓練服務器進行模型的訓練,但實際上這會面臨一系列的挑戰。
首先,如何解決算力規模化問題。對于當前的算力需求而言,盡管英偉達的芯片仍然是業界翹楚,但許多客戶也開始提出了對國產算力的具體要求。因此,適配多架構算力已成為一項重要任務,能讓客戶在一個平臺上同時支持多種芯片及多類算力服務。
其次,如何提升模型訓練效率問題。卡有了,但并不代表算力效率就高,大模型推理和訓練過程是一個軟硬件協調的系統,其中網絡的消耗、I/O 的操作幾乎占據了大模型訓練推理一半時間,企業需要構建一個高性能的網絡,但這是一個巨大的挑戰。
另外,上層應用如何應對高并發的難題,當在一款 APP 端去發布一個火爆應用,無論是文字、文本、圖片、圖像,或者是推理計算的時候,會引發千萬人、上億人在同一秒鐘涌進 APP 進行嘗試。這對應用背后的性能支撐、彈性能力的挑戰是非常強的,類似于極限“秒殺”,這些是自建IDC很難應對的。
除了這些技術層面問題外,還有成本問題。AI 智能應用的能耗密度要比傳統 IT 高出 10 倍以上,整個 GPU 服務器能耗是傳統 CPU 能耗的 10-30 倍。當在大模型應用上計算一道高等數學題時,背后消耗的電量是利用普通搜索引擎檢索的近10倍。對于很多企業來講,去大規模構建智能化應用的時候,持續穩定電力供應以及電力成本也是非常大的挑戰。
“云之于AI,絕不僅僅是算力供應。”劉偉光表示。
阿里云,拉開新一輪基建升級眼下,AWS、Azure、阿里云和GCP等全球頂級云廠商都在圍繞AI基礎設施進行布局,并展開激烈競爭。
具體來講,阿里云已形成了基礎設施即服務(IaaS)、平臺即服務(PaaS)和模型即服務(MaaS)三層架構,可為企業提供大模型的訓練及推理提供高性能、低成本的算力資源和機器學習服務。
這一年多來,阿里云憑借其深厚的技術積累和開源開放戰略,從底層到平臺層再到應用層,構建了一套完整的技術棧,為通義大模型的快速迭代與廣泛應用提供了有力保障。
據獲悉,本次云棲大會上,阿里云智能集團CTO周靖人又公布了阿里云在技術上的最新成果。
在底層支持上,其最新上線的磐久AI服務器,支持單機16卡、顯存1.5T,并提供AI算法預測GPU故障,準確率達92%;
阿里云ACS首次推出GPU容器算力,通過拓撲感知調度,實現計算親和度和性能的提升;
為AI設計的高性能網絡架構HPN7.0,可穩定連接超過10萬個GPU ,模型端到端訓練性能提升10%以上;
阿里云CPFS文件存儲,數據吞吐20TB/s,為AI智算提供指數級擴展存儲能力;
人工智能平臺PAI,已實現萬卡級別的訓練推理一體化彈性調度,AI算力有效利用率超90%。
在平臺層,據獲悉,百煉平臺作為阿里云AI基礎設施的重要組成部分,為開發者提供了便捷的API接口。通過接入百煉平臺,開發者可以輕松調用通義大模型的能力,實現各種復雜的應用場景。這一平臺層的賦能極大地降低了AI技術的使用門檻,加速了AI技術的應用。
在MASS層,通義系列模型通過快速迭代與優化,不斷滿足各類業務需求。
為了讓大模型進一步惠及各行各業,通義千問多款模型進一步降價,Qwen-Turbo價格直降85%,低至百萬tokens 0.3元,Qwen-Plus和Qwen-Max分別再降價80%和50%。其中,Qwen-Plus推理能力追平GPT4,可應用于復雜任務,是效果、速度及成本均衡的最優選擇,降價后,Qwen-Plus性價比達到業界最高,同等規模較行業價格低84%。同時,阿里云百煉平臺還為所有新用戶免費贈送超5000萬tokens及4500張圖片生成額度。
周靖人表示:“云廠商擁有全棧技術儲備,并通過基礎設施的全面升級,讓AI訓練、推理、部署和應用整個生命周期變得更高效。”
大模型落地的點點“星火”,正走向“燎原”得益于完整的AI基礎設施,阿里云通義大模型已經在廣泛的場景中得到了落地應用。2024年云棲大會的展區堪稱大模型的“嘉年華”。三個場館中 ,AI 底層和前沿技術的展商有 17 家,AI 算力計算館展商 有80 家,AI 創新應用的前沿應用館展商數量則高達 170 多家。
受限于場地因素,這些都只是冰山一角。
據公開數據,阿里云通義大模型已經服務了超 30 萬家企業客戶,重點覆蓋了互聯網、金融、汽車、科研、醫療、教育、政務、工業制造和零售等領域,包含營銷設計、社交、AI 游戲、在線教育、智慧終端、自動駕駛、智能座艙、金融客服、政務服務、代碼開發、藥物研發、氣象預測、太空探索等場景。
互聯網距離AI技術最近,與大模型相結合的場景也最豐富。
喜馬拉雅、星巴克、三得利等都是率先將通義大模型應用于營銷設計的公司;微博和小紅書則利用通義大模型把社交“玩”出了新高度;無論是老牌的新東方,還是新興的酷學院和精準學,在線教育機構都在牽手通義大模型來改善學習效率。
游戲行業是擁抱大模型最徹底的行業。完美世界游戲通過接入通義大模型,在劇情、對話和音頻生成等多個環節中獲得了助力,不僅提升了游戲內容的豐富度,也為玩家帶來了更好的沉浸式體驗。網易游戲通過將AI引擎部署在云端,實現了AI隊友的高效推理,極大地豐富了游戲玩法,增強了玩家的游戲體驗。
同時,大模型優秀的泛化能力使得終端更智能、金融服務、政務服務更便捷,軟件開發更高效,等等。
隨著智能手機市場的飽和,通過技術創新吸引用戶成為了一個新課題。vivo基于通義大模型開發的“vivo看見”,通過實時語音播報、畫面內容識別等功能,為用戶提供了全新的交互方式,增加了產品的競爭力。聯想在其AI PC中集成了通義千問等模型,打造了“天禧”個人大模型,提升了智能終端的智能化水平。
在公眾服務方面,眾安保險、盈米基金、紅棉小冰等通過與通義大模型的合作,在智能客服等場景進行了全面升級,有效提升了服務效率和客戶滿意度。上海市徐匯區通過通義大模型的支持,使得涉企服務場景中的咨詢更加準確,服務更加便捷高效。
中國一汽、長安汽車、趣丸科技、哈羅集團等引入通義靈碼,用于提升軟件代碼生成效率。
此外,在大模型的加持下,更多的場景被重構和創造。
智能座艙和自動駕駛讓汽車成為新的物種,小米汽車、極氪汽車、零跑汽車等也都與通義大模型合作,提升智能座艙的體驗。
機器人的出現讓歷史悠久的工業制造重啟智能之路。拓斯達和有鹿的機器人接入通義大模型后,具備了諸多新能力。
當然,大模型帶來的AI技術進步,讓人類不僅關注眼前和腳下,還把探索的焦點投向生命健康、氣候和太空。
攜手阿里云,復旦大學CFFF平臺發布了氣象大模型,并將預測速度從原來的小時級縮短到了3秒內。基于通義大模型,醫藥巨頭阿斯利康搭建藥品不良反應自動分析和總結平臺,使藥物安全把控效率提升300%,準確率從90%提升至95%;國家天文臺和中科院地化所聯合通義大模型,打造出“觀星”和“探月”的垂直大模型,讓中國科研更有競爭力。
上述種種,不一而足。2024云棲大會的召開可謂正當其時,提振了市場對大模型和AI發展的信心。
前年底,當大模型橫空出世時,震撼力非比尋常,從業者對大模型落地應用有各種各樣的暢想,然而經歷了一年多發展后,輿論場上開始出現各種質疑的聲音,認為大模型在應用落地方面未能盡如人意。
但阿里云本次集中展示的大模型落地全景無疑給了市場一劑強心針。無論是通義大模型服務的客戶數目,還是給客戶帶來的價值,都遠遠超出外界期待。
當然,大模型所代表的生成式AI技術還在應用的早期,在大多數人的經驗里還沒有發生過這類事情,本能會產生懷疑,這很正常,因為大部分新的技術革命都會在大多數人的懷疑中成長。
風物長宜放眼量。從1956年達特茅斯會議算起,AI已經走過了近70年的時間,這中間幾度沉沉浮浮,但學界和業界從未喪失信心,接力探索。
在2024云棲大會首日,大家集中討論了這個問題:“今年大模型發展究竟是變快了,還是變慢了?”
“變快了。” 清華大學人工智能研究院副院長、生數科技首席科學家朱軍,階躍星辰創始人、首席執行官姜大昕,月之暗面Kimi創始人楊植麟都出了相同的回答。
作為阿里云的掌門人,吳泳銘則更為樂觀和堅決:“過去22個月,AI發展速度超過任何歷史時期,但我們依然還處于AGI變革的早期。生成式AI最大的想象力,絕不是在手機屏幕上做一兩個新的超級app,而是接管數字世界,改變物理世界。”
- 免責聲明
- 本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。 交易和投資涉及高風險,讀者在采取與本文內容相關的任何行動之前,請務必進行充分的盡職調查。最終的決策應該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產生的任何金錢損失負任何責任。