智譜發布AI應用新進展
給數百位嘉賓發送“一個來自AI的微信紅包”,智譜CEO張鵬需要做的,只是在現場下達一個簡單語音指令。
這些原本對于機器而言相對復雜的操作,可以完全由產品化的AIAgent完成。作為最早探索AIAgent的大模型企業之一,智譜于11月29日帶來了多個新進展:
AutoGLM可以自主執行超過50步的長步驟操作,也可以跨app執行任務;AutoGLM可以“全自動”上網,支持等數十個網站的“無人駕駛”;GLM-PC啟動內測,可以像人一樣操作計算機,進行基于視覺多模態模型實現通用Agent的技術探索。
此前智譜宣布發布AutoGLM,引來多家券商周末緊急跟進研究,二級市場更是由此出現“智譜概念股”。AutoGLM能夠模擬人類操作手機,執行各種任務,包括在微信上點贊并評論朋友圈、在攜程上預訂酒店、在12306上購買火車票、在美團上點外賣等。
根據智譜最新展示的視頻,AutoGLM升級為可以操作手機、電腦,以及實現手機電腦聯動。例如,在采購火鍋食材的例子中,AutoGLM自主執行了54步無打斷操作。并且,在這種多步、循環任務中,AutoGLM的速度表現超過人手動操作。
AutoGLM還可以支持跨App來執行任務。用戶將習慣于AI自動處理,而不是在多個APP間來回切換。由于目前AutoGLM形態更像是用戶和應用間的APP執行的調度層,因此跨App能力是里面非常關鍵的一步。
張鵬宣布,同時AutoGLM啟動大規模內測,并將盡快上線成為面向C端用戶的產品。AutoGLM同時宣布啟動“10個億級APP免費Auto升級”的計劃。
同時,智譜清言插件上線AutoGLM功能,支持搜索、微博、知乎、Github等數十個網站的無人駕駛。在現場demo里,智譜清言插件自動完成了“搜索芒果tv,打開小巷人家,播放最新一集,發彈幕結局打卡”,全程沒有人的干預。
除了手機和瀏覽器,智譜還推出基于PC的自主Agent。GLM-PC是GLM團隊面向“無人駕駛”PC的一次技術探索,基于智譜的多模態模型CogAgent。目前開放第一階段的內測場景,包括:幫用戶預定和參與會議,發送會議總結;文檔處理;網頁搜索與總結等。
張鵬介紹,人用電腦的過程——用眼看圖形及文字,用腦規劃,再用手執行單擊雙擊、輸入等操作。GLM-PC用電腦的方式幾乎完全和人一樣。也正因如此,理論上只要是為人類設計的應用,在GLM-PC學習之后它都能夠執行。這是一種系統級、跨平臺的能力,不依賴于HTML、API,具備更高的能力上限。
不過,由于PC的復雜程度,以及大家在PC完成的幾乎都是復雜任務,坦率地說,今天大模型的能力距離真正代替大家辦公還有一定距離。GLM-PC在當前版本下,用戶仍需要輸入非常精準的指令。
張鵬表示,未來GLM團隊將繼續加速AIAgent模型產品的研發,期待著一句話操作電腦和手機的范式盡快到來。
智譜成立于2019年,由清華大學計算機系的技術成果轉化而來,是新一代“AI六小龍”之一。9月5日,上證報記者獲悉,智譜近日完成了新一輪融資,領投方為中關村科學城公司,該筆資金將用于支持智譜國產基座大模型的技術創新與生態發展。智譜本輪融資規模為數十億元人民幣,投前估值為200億元。目前智譜的股東陣容包括高瓴資本、啟明創投、君聯資本等知名投資機構,以及美團、阿里、騰訊、小米在內的互聯網公司。
(文章來源:上海證券報·中國證券網)
- 免責聲明
- 本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。 交易和投資涉及高風險,讀者在采取與本文內容相關的任何行動之前,請務必進行充分的盡職調查。最終的決策應該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產生的任何金錢損失負任何責任。