對話智譜CEO張鵬:大家對大模型期待過高,ScalingLaw還有很大增長空間|鈦媒體AGI
智譜AI CEO張鵬
大模型“獨(dú)角獸”智譜AI公布最新的 AI 應(yīng)用進(jìn)展。
鈦媒體App 11月29日消息,在上午北京智譜GLM OpenDay上,智譜AI發(fā)布AutoGLM 及 GLM-PC兩款A(yù)I智能體產(chǎn)品。
其中,AutoGLM,基于智譜自研的“基礎(chǔ)智能體解耦合中間界面”和“自進(jìn)化在線課程強(qiáng)化學(xué)習(xí)框架”,是智譜第一個(gè)產(chǎn)品化的智能體 Agent,通過文字/語音指令模擬人類操作手機(jī),實(shí)現(xiàn)大模型從“言”到“行”的范式轉(zhuǎn)變,目前已經(jīng)“百萬內(nèi)測”開放申請;GLM-PC則是基于CogAgent模型的視覺理解和任務(wù)規(guī)劃能力,操作計(jì)算機(jī)的桌面應(yīng)用,用戶通過簡單的一句話即可實(shí)現(xiàn)復(fù)雜任務(wù)的快速執(zhí)行,同時(shí)具有任務(wù)規(guī)劃、屏幕界面信息理解的能力,能夠根據(jù)頁面信息進(jìn)行計(jì)劃更改和自我糾錯(cuò),根據(jù)用戶的指令完成任務(wù)。
智譜 AI CEO張鵬表示,Al Agent今天非常火,從蘋果的 Apple Intelligence、谷歌的 Jarvis,到 OpenAI 即將發(fā)布的 Operator,全球科技巨頭紛紛布局。而國內(nèi)智譜率先開放AutoGLM內(nèi)測,已受到很多關(guān)注,過去一個(gè)月申請頁面已經(jīng)有超過100萬的用戶訪問。
會(huì)后,張鵬對鈦媒體App等透露,大家對于大模型的期待值過高,當(dāng)然這畢竟是一個(gè)高投入的事情。信息的理解在于底層的技術(shù),但底層技術(shù)并不是一個(gè)簡單的單項(xiàng)能力,如果想讓它做生產(chǎn)力工具,面對的是全面性的需求,可能會(huì)存在特別明顯短板,所以智譜不止是技術(shù)上的布局,還需要產(chǎn)業(yè)生態(tài)的布局。智譜主要定位是“開放平臺(tái)”,助力大家去做原有產(chǎn)品的改造,有能力的探索。
“確實(shí),因?yàn)閿?shù)據(jù)和訓(xùn)練規(guī)模原因,Scaling Law可能不像我們之前預(yù)測的一樣,還是會(huì)指數(shù)級往上漲。但是你放更寬的范圍來看這件事,我們不只單獨(dú)去看,所以我們不止要看現(xiàn)象,而是要看這個(gè)現(xiàn)象的本質(zhì),我們都在尋找。相對來說,我們依然還是比較樂觀,我覺得Scaling Law還是有很大的空間,延續(xù)我們帶來的技術(shù)增長。”張鵬稱,相對于語音,視覺Scaling Law還是在漲的,因此他認(rèn)為,計(jì)算量可能是Scaling Law發(fā)展趨勢的最佳解釋。
針對于發(fā)展端側(cè)Agent之后,智譜是否還做預(yù)訓(xùn)練基座大模型,張鵬沒有進(jìn)行回應(yīng)。
據(jù)悉,成立于2019年的智譜 AI,由清華大學(xué)計(jì)算機(jī)系的技術(shù)成果轉(zhuǎn)化而來,源自清華大學(xué)知識(shí)工程(KEG)實(shí)驗(yàn)室,是國內(nèi)最早入局大模型賽道的公司之一,也是目前國內(nèi)“大模型六小虎”(智譜、百川、月之暗面、零一萬物、MiniMax、階躍星辰)之一。
自2023年3月智譜 AI 推出千億開源基座對話模型ChatGLM系列以來,GLM大模型經(jīng)歷四個(gè)大版本迭代,共發(fā)布了超過20款 AI 模型技術(shù)和產(chǎn)品。
智譜AI聚焦于基座模型的研發(fā)投入,落地方向以TO B賽道為主,以TO C賽道為輔。談及國內(nèi)的大模型賽道,張鵬曾表示,國內(nèi)大模型賽道過于擁擠以至內(nèi)耗,更符合商業(yè)規(guī)律的模式應(yīng)走向分層——先基座大模型,再行業(yè)側(cè)模型,再面向更加細(xì)分場景的推理模型。國內(nèi)創(chuàng)業(yè)生態(tài)在分層方面較美國略慢,而美國在多樣性方面選項(xiàng)會(huì)更多。
To B端層面,截至2023年底,智譜 AI 已擁有超2000家生態(tài)合作伙伴、超1000個(gè)大模型規(guī)模化應(yīng)用,覆蓋傳媒、咨詢、消費(fèi)、金融、新能源、互聯(lián)網(wǎng)、智能辦公等多個(gè)細(xì)分場景。
融資方面,智譜AI已完成九輪融資,總額接近60億元人民幣。
其中,2023年智譜 AI 累計(jì)融資額超過25億元人民幣,投資方包括君聯(lián)資本、啟明創(chuàng)投、中科創(chuàng)星、美團(tuán)、螞蟻、阿里、騰訊、小米、金山、順為、Boss直聘、好未來、紅杉、高瓴等多家機(jī)構(gòu);2024年3月,北京市人工智能產(chǎn)業(yè)投資基金參與投資智譜華章;今年6月,沙特阿美(Aramco)旗下風(fēng)險(xiǎn)投資部門管理的基金Prosperity7投資智譜 AI,本輪總?cè)谫Y額達(dá)到4億美元(約合人民幣28.94億元);今年9月,北京海淀設(shè)立的市場化投資平臺(tái)中關(guān)村科學(xué)城公司宣布,以投前200億元估值領(lǐng)投智譜華章(智譜 AI)新一輪融資,金額達(dá)數(shù)十億元。
如今,智譜全面發(fā)力 AI 智能體應(yīng)用。
事實(shí)上,智譜已在芯片、應(yīng)用app、操作系統(tǒng)OS 和模型側(cè)進(jìn)行了長時(shí)間、全鏈路布局。
2023年4月,AgentBench項(xiàng)目啟動(dòng);今年1月,智譜All Tools 能力率先發(fā)布,它能自動(dòng)調(diào)用代碼解釋器、web 瀏覽器和文生圖模型等;今年4月,AutoWebGLM公布,成為首個(gè)全面超越GPT-4,網(wǎng)頁瀏覽能力的模型。此外,智譜與高通、三星、英特爾、榮耀、華碩等端側(cè)芯片、手機(jī)、電腦廠商合作,聯(lián)合發(fā)力大模型應(yīng)用,在 AIPC、智能助手等領(lǐng)域落地。
張鵬認(rèn)為,通過端側(cè)芯片性能優(yōu)化和端云一體架構(gòu);Agent 不僅在操作系統(tǒng) OS 和應(yīng)用App上實(shí)現(xiàn)用戶體驗(yàn)變革,還能將其推廣到各類智能設(shè)備上,實(shí)現(xiàn)基于大模型的互聯(lián)互通。
如今,今天的Agent可以做到像人一樣,理解界面、規(guī)劃任務(wù)、使用工具、完成任務(wù),從而更聰明地代替人類行動(dòng)。
他分析稱,大模型發(fā)展至今開始逐步具有上述人類與現(xiàn)實(shí)物理世界互動(dòng)的能力:L1語言能力進(jìn)程 80%、L2邏輯能力(多模態(tài)能力)60%、L3使用工具的能力進(jìn)程 30%,甚至L4自我學(xué)習(xí)的能力也正在逐漸出現(xiàn)。
“大家都知道,大模型不只是Chatbot,它的價(jià)值遠(yuǎn)超于Chatbot。其本質(zhì)在于對世界的“理解”能力以及序列輸出能力。過去兩年,智譜致力于將這種“理解”能力融入各行各業(yè)及各種場景,與在場眾多客戶和伙伴進(jìn)行了大量實(shí)踐。在探索的過程中,我們也不斷思考大模型的“序列輸出”意味著什么,以及應(yīng)以何種形式呈現(xiàn)。我們認(rèn)識(shí)到,輸出形式不僅限于語言文本,更可以擴(kuò)展至圖像視頻,甚至是操作/Action。我們的階段性成果就是大家今天看到的Agent應(yīng)用。”張鵬稱。
“當(dāng)然,雖然展現(xiàn)出比較大的進(jìn)步,但與人類的表現(xiàn)相比Agent仍有較大差距。目前我們?nèi)祟惡敛毁M(fèi)力完成的一些操作 (滾動(dòng)、拖動(dòng)、縮放),對Agent來說也是極具挑戰(zhàn)的。因此在L3階段,智譜今天的理解是才走到30%。”張鵬稱,盡管目前技術(shù)還比較初期,但 Agent的未來應(yīng)用已經(jīng)展現(xiàn)出了強(qiáng)大的前景。目前的Agent能力更像是在用戶和應(yīng)用之間,增加一個(gè)智能的調(diào)度層,鏈接所有應(yīng)用甚至是所有設(shè)備。這可以看做是大模型通用操作系統(tǒng)LM-OS的一種雛形。
會(huì)后交流時(shí),張鵬表示,“所以很多時(shí)候我們看待問題,它更多的是一個(gè)技術(shù)導(dǎo)向,二個(gè)是最終的目標(biāo)導(dǎo)向,而不是僅僅局限于單項(xiàng)技術(shù)的快速變現(xiàn)。我們還是最終的目標(biāo)還是面向的是說,最終要幫助大家切切實(shí)實(shí)的去解決生產(chǎn)力的問題,而非簡單盈利。所以,我們需要更中長遠(yuǎn)去做這個(gè)事情,從生態(tài)建設(shè)上也是一樣,就像今天我們可以看到,很多伙伴、很多客戶其實(shí)是在我們開放的技術(shù)體系之上構(gòu)建發(fā)展自己的應(yīng)用和商業(yè)價(jià)值。”
“為用戶創(chuàng)造價(jià)值,這個(gè)是最重要的。我們無意跟這些(廠商)強(qiáng),而是我們再找其他新的方式,讓用戶得到最真實(shí)的價(jià)值,讓他們自己去投票。操作系統(tǒng)在合作,嘗試把我們的 AI 能力去合作進(jìn)去。”張鵬稱。
談到 AI 智能體和搜索關(guān)系,張鵬提到,在辦公應(yīng)用場景中,AI Agent助手可以幫你解決一些問題,提升工作效率,所以智譜希望推動(dòng)AI Agent技術(shù)本身的應(yīng)用產(chǎn)生價(jià)值。而搜索是一個(gè)重要場景。
張鵬強(qiáng)調(diào),AI Agent已經(jīng)對人機(jī)交互形式產(chǎn)生極大的影響。未來,基于大模型智能能力(從L1 到L4乃至更高),有機(jī)會(huì)實(shí)現(xiàn)原生的人與機(jī)器交互的方式LM-OS,這將從根本上改變?nèi)伺c機(jī)器交互的方式。
“人的需求往懶惰方向走,但技術(shù)永遠(yuǎn)是在幫助大家解決問題。”張鵬稱,
(作者|林志佳,編輯|胡潤峰)
- 免責(zé)聲明
- 本文所包含的觀點(diǎn)僅代表作者個(gè)人看法,不代表新火種的觀點(diǎn)。在新火種上獲取的所有信息均不應(yīng)被視為投資建議。新火種對本文可能提及或鏈接的任何項(xiàng)目不表示認(rèn)可。 交易和投資涉及高風(fēng)險(xiǎn),讀者在采取與本文內(nèi)容相關(guān)的任何行動(dòng)之前,請務(wù)必進(jìn)行充分的盡職調(diào)查。最終的決策應(yīng)該基于您自己的獨(dú)立判斷。新火種不對因依賴本文觀點(diǎn)而產(chǎn)生的任何金錢損失負(fù)任何責(zé)任。