阿里云allinAI的決心
如何抓住 AI 的機會?
這是進入大模型時代后,面對新的起點,各大云廠商在不斷思考的問題。
毋庸置疑,AI 與云已經成為緊密的拍檔。大模型的迭代進化離不開云計算的支撐,而大模型的落地應用,給云計算勾勒了一個比移動互聯網更具想象力的新世界。新一輪的云計算周期已然開始了。
在海外,老牌巨頭微軟憑借 AI 在一年多內搖身變成了最潮科技公司;在國內,阿里云走在最前列,是唯一兼具強大模型和完備云平臺的大廠,而且還選擇了開源。
事實上,阿里云早在 2019 年便投入大模型研發,2022 年喊出MaaS(模型即服務)第一聲,此后又從底層算力(IaaS)到 AI 平臺(PaaS)再到模型服務(MaaS)全棧重構,走出了一條云+ AI 的獨特路徑。從模型到平臺到算力底座全方位投入,選擇“既要、又要、還要”,阿里云幾乎是唯一的樣本。
那么,阿里云的“云+ AI ”啟示錄能成為 AI 時代云廠商變革的新范本嗎?
5 月 9 日,阿里云在北京舉辦 AI 智領者峰會,此時距離通義大模型問世正好一周年。阿里云首席技術官周靖人作了全面總結,關于大模型能力,關于模型落地,關于開源與生態。
01從追趕到并行,技術永遠是硬實力
距離ChatGPT 引爆新一輪 AI 浪潮已經一年多,在這段一路狂奔、野蠻生長的日子里,大模型軍備競賽的風從沒停過,從架構到參數,從單一語言大模型到多模態大模型,從基礎大模型到行業大模型……
“卷生卷死”的百模大戰帶來的啟示是,夯實基礎模型的能力,永遠是發展的硬道理,技術就是硬實力。
憑借技術實力在云計算時代叱咤風云的阿里云,自然懂得大模型能力的重要性,這是它想要走好“云+AI”的技術路徑的關鍵一步。
結合通義大模型的迭代升級速度來看,阿里云在推進模型能力上的步伐很是穩健。
去年 4 月,通義大模型問世,緊接著阿里云持續聚焦基礎模型的技術研發,綜合性能超越 GPT-3.5 的通義千問 2.0、通義千問 2.1 相繼推出。
如今,在距離通義大模型問世一周年之際,阿里云又帶來了最新升級的通義大模型。
5 月 9 日,阿里云首席技術官周靖人宣布通義千問 2.5 正式發布,模型能力再次迎來新突破。
據介紹,相較于通義千問 2.1 版本,通義千問 2.5 的理解能力、邏輯推理、指令遵循、代碼能力分別提升9%、16%、19%、10%。
此外,與 GPT-4 相比,中文語境下,通義千問 2.5 文本理解、文本生成、知識問答及生活建議、閑聊及對話、安全風險等多項能力趕超 GPT-4!
而在權威基準 OpenCompass 上,通義千問 2.5 得分追平 GPT-4 Turbo——這也是國產大模型首次在該基準取得如此成績,可謂是“地表最強中文大模型”。
同時,通義還發布了最新款的開源模型——1100 億參數的 Qwen1.5-110B,超越 Meta 的 Llama-3-70B 模型,成為“開源領域最強大模型”。
不僅是語言大模型,在多模態大模型、行業大模型上,阿里云也在持續發力。通義千問視覺理解模型 、通義千問代碼大模型等分別在各大基準榜單上名列前茅。
但單一的榜單數據并不能說明一切,來自用戶的使用感受似乎更能說明模型的真實水準。
據統計,如今通義大模型的日調用量早已過億,通過阿里云服務的企業超 9 萬、通過釘釘服務的企業則超過 220 萬,通義開源模型累計下載量突破 700 萬,成為中國企業最受歡迎的大模型。
雖然已經在模型能力上已經實現了從最初的追趕到并行,但對于阿里云來說,這還不夠。
正如周靖人所言,當前大模型有那么多家,大家說的都是同樣的故事,但最后比拼的其實是能力差異,以及接下來的如何融合生態(尤其是開發者的生態)、如何落地運用起來,這才是最大的差異。
基于阿里云在大模型能力上的積累,讓企業和開發者將模型“玩轉”起來,是阿里云要思考的第二個問題。
02全面升級百煉平臺,加速大模型落地應用
從去年下半年開始,大模型的戰事信號已經開始從“做大模型”向“用大模型”轉變。2024 年,商業化、落地應用成為大模型公司的主旋律。
最新的《中國大模型中標項目監測報告》顯示,今年 1-4 月,可統計到的大模型相關中標金額已達到 2023 年全年披露金額的 77% 左右,涉及政務、金融、運營商、能源、教科、交通等各行各業,表明企業對大模型的應用需求正快速增長。
但,大模型的落地,并不是通過卷算力、卷參數的“暴力革命”就能實現,中間需要一個漫長的過程。
因為對于基礎大模型來說,它所具備的更多是通用知識,但在具體落地過程中,大模型面對的是各種各樣的垂直業務場景,而千行百業中的每一個企業都有自己明確、特殊的需求。
如果無法解決這些問題,大模型的落地并非易事。周靖人告訴,在與大部分企業接觸過程中接收的需求反饋,讓阿里云意識到,“如果不對基礎模型進行修整,難以直接對接業務需求。”
基于此,阿里云給出的解法是為用戶和開發者提供一個工具平臺——一站式大模型和應用開發平臺,簡化用戶在部署大模型時所需進行的底層算力部署、模型預訓練、工具開發等復雜工作。
去年 10 月,百煉大模型平臺正式推出,這意味著開發者僅通過“拖拉拽” ,5 分鐘即可開發出一款大模型應用,幾小時“煉”出一個專屬模型,大大降低開發門檻。
如今半年多過去,此次 AI 峰會上,阿里云宣布對百煉平臺進行全面升級,從模型開發、應用開發到算力底座,變得更加易用、開放。
另外,還引入了更多模型,同時率先兼容LlamaIndex等開源框架,企業可自由替換能力組件來適配自身系統。
針對當下企業最關注的RAG鏈路,百煉提供靈活開放的企業級檢索增強服務,“5 到 10 行代碼”即可搭建 RAG 應用,讓大模型擁有“最強外掛”。
具體來看,針對企業應用大模型的三種范式,百煉提供了豐富的模型和易用的工具箱。
一是對于那些希望直接“開箱即用”的企業,百煉集成了上百款大模型 API,除了通義、Llama、ChatGLM 等系列,還首家托管百川等系列三方模型,覆蓋國內外主流廠商,同時支持企業上架通用或行業模型,提供足夠多的模型選擇。
二是對于那些需要對大模型進一步微調的用戶,百煉提供從數據管理、模型調優、評測到部署的全鏈路模型服務,用戶可彈性按需調用算力,無需關心底層架構。訓練過程可視化,還可自動評測模型質量,并與其他模型對比。
三是對于那些希望打造 RAG 等應用的企業,百煉支持 Assistant API 開發模式,可在百煉上輕松創建知識庫,并一鍵開啟知識檢索增強(RAG)。
據悉,目前,一汽、微博、小米、完美世界、朗新集團、央視網等企業都已經應用上百煉平臺。
03打造開源模型+開放的云生態
技術要有好的發展一定要有生態,而不是閉門造車。阿里云早就意識到了這一點——阿里云是全球唯一一家積極做最先進的 AI 模型同時,也敢于全方位開源的云計算廠商。
阿里云想要打造一朵AI時代最開放的云。
其實,開源VS閉源,一直是大模型廠商所面臨的艱難抉擇。
堅定閉源路線的企業認為,閉源能夠維持技術上的護城河,是更符合實際的理想商業模式。而堅持開源路線的企業則認為,眾人拾柴火焰高。
此前,IDC 的一項調研數據顯示,在實際應用開發過程中,企業采用開源模型與商業化模型的比例為 51% 與 49%。
而周靖人認為,開源,對整個技術領域的貢獻毋庸置疑。開源模型給了企業和開發者更多選擇,大家不用擔心被綁定在某一家的產品或技術線上,同時也可以最大程度地自由使用不同模型進行應用創新。
“無論是 PC 端還是手機端,要能夠與各種各樣的場景做適配,快速搭建起更加復雜的業務、AI 系統,其實這都需要一個開放開源的生態,這也是全球開發者和企業在毫無疑問地擁抱‘開源’體系的原因。”周靖人說道。
因此,去年 8 月通義宣布加入開源行列后,便一直堅定開源路線,沿著“全模態、全尺寸”開源路線陸續推出十多款模型。
據了解,目前通義已經開源了 8 款參數規模從 5 億到 1100 億的大語言模型。
開源的本質是交流,歷史上多種技術的突破都證明了這一路徑對更大圖景的推動作用。打通接口、拉平認知,釋放大模型能力,將對整個中國 AI 發展都起到積極作用。
正是早早意識到這一點,所以阿里云在 2022 年的云棲大會上宣布搭建魔搭(ModelScope)社區,這也是國內首個 AI 模型開源社區。
據了解,魔搭社區彼時一經推出,便將阿里近五年苦心研發的 300 多個優質模型全部開源,促進中國的 AI 基礎研究。
而目前,據周靖人介紹,魔搭社區平臺還在擴大建設,平臺上的高質量開源模型總數已超過 4500 個,開發者數量超過 500 萬,已成長為“中國最大的AI模型社區”。
周靖人堅信,大模型還有很大一部分潛力沒有真正被挖掘出來,當有越來越多的開發者、企業能結合自己的需求,來促進大模型的發展和應用,將帶來翻天覆地的變化。在當下這個時間點,阿里云希望以開放的心態把最先進的技術開源出來,大家做并行探索。
“這很重要,能對大到每個產業,小到每個企業的創新性開發起到促進作用。”
04寫在最后
大會現場,當被問到,曾經在云計算時代擁有絕對領先地位的阿里云(中國第一、亞太第一),如何在 AI 時代繼續保持領先時,周靖人沉思了一下,回答道,早在大模型浪潮到來之前,阿里云就已預判業界發展趨勢,率先提出 MaaS 理念,布局未來。
2022 年 11 月初,ChatGPT還未問世,在云棲大會上,作為阿里云大模型研發負責人的周靖人即提出 MaaS (模型即服務)——把模型作為重要的生產元素,圍繞模型的生命周期設計產品和技術,包括數據處理、特征工程、模型的訓練和調優、模型的服務等。
這是一條從未被提及的新概念。
后來的事情大家都知道了,當 2023 年年初 ChatGPT 拉下 AI 新時代的序幕,大模型進入“百模大戰”階段,MaaS 這一理念被廣泛提及、驗證,并逐漸被亞馬遜、微軟以及騰訊、百度等國內外云廠商所沿用,將其作為自己在新時代 AI 技術變革中轉型的新選擇,MaaS 成為最有望改變云廠商商業模式的路徑。
如今,距離阿里云提出 MaaS 已有一年多,根據所交出的答卷,可以拼出,在 AI 時代,阿里云基于 MaaS 做出的完整戰略布局。
模型層面,聚焦通義大模型的技術研發,將最好的大模型提供給客戶;模型服務層,以百煉大模型平臺為主要界面,針對企業應用大模型時的需求,提供模型調用、微調、訓練、開發專屬大模型及應用的工具服務;AI 基礎設施層,依靠云計算體系,為其他大模型公司提供算力平臺;生態層,持續構建開源開放的開發者生態,推動整個行業的發展。
以模型為中心,全面重構自身技術架構;同時,作為平臺,為中國企業、開發者以及大模型生態中的公司提供模型相關的各類服務,最終推動整個產業的共同發展。
這就是阿里云想要在 AI 時代講述的MaaS新敘事。
“只有這樣,在 AI 時代,阿里云才能仍然是 No.1,仍然能為各行各業提供最先進的技術、最廣泛的產業應用。”
AI 時代,阿里云將如何保持行業的引領者定位,拭目以待。
- 免責聲明
- 本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。 交易和投資涉及高風險,讀者在采取與本文內容相關的任何行動之前,請務必進行充分的盡職調查。最終的決策應該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產生的任何金錢損失負任何責任。