首頁 > AI資訊 > 最新資訊 > 昆侖萬維方漢:大模型時代,超級APP不會是神話

昆侖萬維方漢:大模型時代,超級APP不會是神話

新火種    2023-12-07

昆侖萬維方漢:大模型時代,超級 APP 不會是神話

作者丨何思思

編輯丨陳彩嫻

“艱苦奮斗,獨立自主”——這是昆侖萬維董事長兼CEO方漢做大模型3年以來的真實感受。

早在今年4月,昆侖萬維就發布首款千億級參數大模型“天工”,是國內最早一批擁有大模型的企業之一;今年8月,昆侖萬維更是推出了國內首個融合了大模型能力的搜索引擎——天工AI搜索。

作為一家以游戲得名,后來發展成為國內互聯網平臺的出海企業,昆侖萬維曾相繼并購孵化了包括Opera、StarMaker等在內的多款現象級應用。

然而從游戲互聯網公司到大模型,終究不是一步簡單的跨越。“從游戲到出海再轉做大模型,是一個如此大的跨界,底氣在哪兒?能做成嗎?還是在搶噱頭?”

方漢對AI科技評論表示,其實昆侖萬維對大模型的研究遠比想象中要早得多,時間回到2020年,這一年ChatGPT還沒有火,但當時昆侖萬維就押注了AIGC賽道。

談及為何先于ChatGPT出圈前,就入局大模型賽道?

方漢告訴AI科技評論:在外界看來跨度很大,但理由是很充分的。首先和公司的業務相關,昆侖萬維在海外主要主要做內容平臺,包括音樂、社交、游戲、動漫等,這意味著我們對任何一項技術變革都是非常敏銳的。另外還一個重要的原因是,較元宇宙、VR來說,AIGC和相關產品的結合,能更容易地覆蓋更多的普通人群。

2022年春節,昆侖萬維內部提出“All in AIGC”的口號,同年年底發布了開源項目。

時間來到2023年,此時大模型在國內蓬勃發展,昆侖萬維也加快了大模型以及相關產品的研究進度。大模型層面,4月份發布了“天工”大模型,產品應用層面,初步形成包括 AI大模型、AI搜索、AI游戲、AI社交、AI音樂、AI動漫等六大方向在內的 AI業務矩陣。

值得注意的是,從入局時間來看,昆侖萬維要早于國內大部分企業,這也從側面說明了昆侖萬維在大模型這條新賽道上并非坦途。

“我們沿著GPT的路線辛辛苦苦做了3年,但這些苦難也鍛煉了我們獨立解決問題和處理問題的能力,我們把這段經歷總結為‘艱苦奮斗,獨立自主’。”方漢笑著說道。

除了研發通用大模型,專有模型以及上層應用外,方漢更是將開源的基因融入其中,基于天工大模型,昆侖萬維選擇開源了「天工」Skywork-13B系列大模型。

面對開源與閉源之爭,方漢表示,兩者并不矛盾,互為有機組成部分,開源的本質是為了構建良好的生態,讓更多中小企業能夠在大模型基礎上開展一些工作。

“昆侖萬維的體量相對較小,所以我們對大模型的研究會朝著離應用更近的方向發展,”之于未來在大模型方面的規劃,方漢如是說。

以下為AI科技評論和方漢的對話:

跨界:不是為了股價,而是業務發展所需

AI科技評論:從游戲到出海,再到大模型,為什么要跨這么大的界?

方漢:在外界看來跨度很大,但其實理由是很充分的。

首先和公司業務有關。做游戲之前,我們是在海外做用戶增長的,而且在這方面有豐富的經驗。上市時我們就有了一個判斷,我們的增長能力大多在網游端,但當時我們也在想是不是可以把這種能力賦能到別的互聯網品牌上,因為我們知道中國人在海外做一個新的廠牌其實有難度的,所以我們就買了Grindr,把用戶量做大了五倍;然后買了StarMaker,用戶量從2000人做到了大概近千萬的日活。我們收購Opera后孵化出了三個產品,一是Opera News,目前是非洲最大的客戶端;二是OPay,非洲的支付平臺;三是Opera GX Browser,目前在歐美地區月活達到3000萬。所以我們在海外做平臺增長的經驗非常豐富。

另外,我們在海外做的是內容平臺,包括音樂、社交、游戲、動漫等,這就意味我們對任何一項技術變革都是非常關注的。還有一個原因,較元宇宙、VR來說,AIGC更容易覆蓋更多普通人群。為什么呢?當時雖然ChatGPT還沒出來,但是抖音上的換臉玩法已經出來了,其實背后都是AI技術的支撐,只是沒有現在這么明顯而已。

當時我們還做了一個測試:一塊手表的重量是70克,手機是300克到400克,但當時的VR設備大概在一斤半左右,所以以我們當時的看法,認為VR賽道很難做起來,因為實在太重了。元宇宙則是另外一個邏輯,我們認為元宇宙在人和人溝通的效率方面實際上比不上線下見面,所以我們認為元宇宙也不會有很大的市場。

但AI就不一樣了,目前90%的美國大學生都在使用ChatGPT做作業,國內很多電商基本上都在用AIGC生成商品圖片。這一波AI對普通人的滲透遠比我們想象得要大的多。所以我們認為AIGC和之前的互聯網和移動互聯網兩波浪潮一樣,會是一個大的技術變革,我們就決定投入了。

AI科技評論:什么時候決定全方位投入的?

方漢:2020年GPT3出來時,我們就很快地意識到了AIGC會是一個非常大的里程碑。2021年開始鋪算力,并訓練出了一個140億參數的大模型,同時組建了一個專門做音樂生成的團隊;2022年春節,內部開了戰略會,提出了All in AIGC的口號;2022年年底12月份,疫情剛放開時,我們就發布了開源項目,其實當時ChatGPT還沒有火,對于像我們這樣一個中等體量的互聯網公司來說,我們做的事情要比業界同行稍微早一些。

AI科技評論:最初瞄準的就是AGI嗎?

方漢:首先,我們跟進大模型這件事,完全不是為了股價。因為AGI和AIGC是兩碼事,所以當時只想到了AIGC對我們公司業務的發展非常重要。包括我們現在設立的音樂、漫畫、社交、游戲等方向,都是我們的傳統產品,只有AI搜索算是和大模型結合后的一個新發現。

當然,天工大模型是通用大模型,但是想要在每個行業落地,還要在對應的專有模型上做應用,所以在天工大模型這個底座之上,還訓練出了3D生成模型,圖像生成模型、視頻生成模型,音樂生成模型等專有模型。

入局大模型:沒有參考,只能獨立自主

AI科技評論:最初選擇的是Bert路線還是GPT路線?早期國內大部分企業可能都是基于Bert做研究的。

方漢:我們最初選擇的就是GPT路線,當時沒有任何開源框架可以參考,所以我們是沿著GPT的路線辛辛苦苦做了3年。在國內廠商里是相對非常早期的。(更多關于大模型行業的故事,歡迎添加微信 ericahss1224,互相交流,互通有無)

AI科技評論:這個過程中有什么困難點嗎?畢竟起步確實太早了。

方漢:2020年剛開始做的時候,確實挺辛苦的。因為沒有任何可以參考的內容,而且當時國內大部分企業走的是Bert路線,GPT路線的人不好找,所以只能根據一些公開文獻從頭研究。

但這樣也鍛煉了我們獨立解決問題和處理問題的能力,我們把這段經歷總結為“艱苦奮斗,獨立自主。”以數據處理團隊為例,從2020年搭建到現在,應該是國內最老牌、最成熟的團隊了。

AI科技評論:現在很多企業都在強調數據的量和質量,對于昆侖來說,數據是最難攻克的一關嗎?

方漢:數據處理肯定是一個難點。對于大模型訓練來說,數據質量的重要性往往高于數據的量,因為數據很容易收集,但高質量的數據很難。

比如,中國擁有全世界最大的中小學生題庫,但這個題庫你直接問題大模型質量是很差的,因為題庫中的數據沒有經過標準化和格式化的處理。所有公式可能都是圖片文件,這就要把這些公式全部轉成文本可描述的文件。這就要花很長時間才能完成。像中國可能有兩億道中小學生題庫,處理完了之后質量高的可能不到一千萬道,這是一個很辛苦的數據處理過程。當然這個過程也會涉及到數據清洗、加工、重新整理。最麻煩的是針對質量不好的數據,要想辦法寫工具,把質量變好,甚至要雇一批數據標注人才把數據標好,這是相當麻煩且繁瑣的工作。

另外,在數據層面,最重要的不是數據加工的能力而是數據生產的能力,目前很多數據是空白的,尤其是在一些很窄的領域,所以必須生產出來。以音樂數據為例,全世界每年能夠生產3億首,其中中國每年就能生產200萬首歌,但實際上可能只有20萬首是標注好的,那怎么辦?只能自己花錢加工數據。所以現在質量高的數據是非常稀缺的。

AI科技評論:其實數據層面,也會涉及到數據合規的問題?

方漢:首先要有一個正確的心態,我們一直認為數據合規和法律監管是行業健康發展的前提,所以我們一開始就會配合各部門完成數據保護等工作,這是最關鍵的。我們認為有監管比沒監管好,如果沒有監管的話,各種不健康不合規的東西出來了,行業的發展會受限制,企業的損失也會很慘重。

在出海過程中,中國一些企業就是因為不重視合規,出現了各種各樣的問題。對于大模型訓練來說也是一樣的,最關鍵的是敏感數據不能出境。

我們在東南亞、歐洲等地區發展好的原因就在于我們堅決服從監管,而且最大限度地配合監管部門做事。國內也一樣,我們是全國第二家提交大模型審核的企業,北京市第二批通過的。

其實AI這波數據保護法規,各國還在規劃中。我們也在緊密關注,會全力配合。中國是大模型落地比較早的國家,所以我們配合得非常好。其他國家可能還沒有完全落地,但我們在持續關注。

AI科技評論:美國的持續封鎖,會不會有算力方面的擔憂?

方漢:肯定會有影響。現在業界出現了兩個新的摩爾定律,一是,出自OpenAI——每18個月人類的知識會翻倍,我對此表示質疑;

二是,大模型的訓練和推理成本會以每年10倍的速度遞減,也就是說每年的訓練成本和推理成本會下降10倍左右,我表示贊同。為什么?因為現在所有人都在拼命優化,也出現了很多新的理論,比如最早的文生圖基本15分鐘才能完成,現在4、5秒就能完成了,直接降了60倍。

另外,手機上現在已經能跑7B、13B的模型了,5年之后手機上一定能跑80B的模型,所以最后離線推斷一定會成為主流。

AI科技評論:現在國內很多企業還是有算力方面的擔憂的,國內有可替代的嗎?

方漢:華為910B幾乎能達到A100 85%的性能,主要問題在于他的底層軟件的穩定性和硬件的兼容性還在不斷修補中,但是用作推理已經沒有任何問題了,訓練還差一點,還需要大家陪著它再改一段時間。

國內能夠達到910B水平的一共只有兩三家,但是國產芯片最大的問題是產能,只要產能上去了,肯定能替代。國內芯片在設計上一點也不落后,和A100的差距已經不大了,H100和H200還需要時間追趕。(更多關于大模型行業的故事,歡迎添加微信 ericahss1224,互相交流,互通有無)

面對競爭:差異化是前提,其次是認知

AI科技評論:相對于其他五款產品來說,AI搜索是新產品,為什么選擇搜索這個方向?

方漢:很簡單的邏輯。AI搜索不是憑空產生的,是舊的技術和大模型技術結合后推出的新產品。

其實我們做搜索已經有6年的時間了。在這方面的技術儲備遠比想象的多,早期我們做Opera News,它的背后其實是有一個搜索引擎支撐的,這個搜索引擎每天可能要收集幾千萬個英文的站點,把新聞抓取下來然后轉成用戶可以訪問的,就像今日頭條一樣。所以AI搜索反而是最早ready的。

AI科技評論:除了AI搜索,還有游戲、社交、音樂等產品,這些產品的推出節奏是什么樣的?

方漢:基本會跟用戶的節奏走,我們會在用戶端不斷地測試,一旦我們認為測試效果、數據和用戶的反饋達標了,就會推出來。目前除了AI搜索外,AI音樂、AI動漫、AI社交和AI游戲等產品都在海外市場測試中。

AI科技評論:可以理解為AI搜索主要面向國內,其他產品面向海外?

方漢:其他五款產品在海外落地成功后,會考慮在國內進行推廣。

首先全世界付費習慣最好的市場是歐美,其次是中國。我們首選歐美市場,因為歐美用戶的付費習慣比較好,目前OpenAI付費最多的用戶也集中在歐美市場。所以會選擇先做價值較大的市場。

AI科技評論:其實現在各大廠都在做產品的重構,昆侖在這方面有什么不同?

方漢:大家的思路不同,我們一直在做面向C端的端到端的內容生產方。

其實從去年我們就一直在思考大模型之后是什么,當時我們就預判了肯定是千模大戰,但是在這場戰役中,我們不一定能勝出。所以我們就想清楚了,不做效率工具,只做平臺。這個事情其實比大家想的要早一點。

AI科技評論:關于C端,大家都在討論超級應用,您認為距離下一個超級應用,還有多長時間?

方漢:肯定有超級應用,但不止一個超級應用,互聯網時代誕生了谷歌、亞馬遜、Meta(Facebook),移動互聯網催生了Snapchat、Twitter,包括國內的字節、美團、滴滴等都是超級APP,但沒有一個超級app能把所有超級APP集合起來。所以我認為一個超級APP包打天下是不太可能的,未來可能會出現幾個超級APP。

聚焦到具體的領域,游戲和電影一樣不太可能出現超級APP,社交、音樂、動漫等都有可能。

AI科技評論:關于C端,大家都在討論超級應用,您有信心嗎?

方漢:信心肯定得有,我也相信我們一定能做出超級APP。因為我們做的比較早,希望也比較大,但誰也不敢保證100%一定能做成,畢竟機緣巧合的事情太多了。只能說我們會盡力朝著超級APP的方向努力,所以我們一直做平臺,不做工具。因為做工具是做不成超級APP的。

大模型形態之爭:開源是大趨勢

AI科技評論:除天工外,昆侖還開源了13B模型,好像很多廠商都喜歡把6B、7B或者13B作為一個節點?

方漢:其實邏輯很簡單,和顯存相關。4090消費級顯卡的內存是24G,6B需要12G,13B需要26G左右。所以6B和13B都是消費級顯卡,大家可以直接拿回去玩,或者供小企業使用,因為消費級顯卡特別便宜。為什么A100、H100性能高,因為一個是40G內存,一個是120G,單卡多少G的內存是非常關鍵的。

這就是為什么蘋果新一代筆記本特別強的原因,因為它能跑到196G。所以最新版本的蘋果電腦理論上可以跑一個300B的模型,只是慢一點而已。

AI科技評論:那為什么參數大的模型會選擇閉源?是商業化方面的考慮?

方漢:因為大部分人都跑不起來,你說是為了商業化考慮嗎?任何一家大模型企業都要考慮商業化,這是一件非常正常的事情。實際上最重要的還是底座大模型,一個千億級別的大模型對我們而言,最關鍵的是技術機密。在這之上訓練出很多小模型開源給大家使用,完全是沒問題的。

AI科技評論:昆侖為什么要選擇開源?怎么看待開源和閉源的關系?

方漢:我認為開源的話,做生態比較容易,對中小企業的機會也會更大。

開源和閉源并不矛盾,二者互為有機組成部分。這和做開源公司的leader的商業模式有關。

就像Meta(Facebook)屬于后來的攪局者,對他來說,他不依靠大模型,對他的業務也沒有致命性的影響,所以他就直接開源了,所以現在開源模型最好的是Meta的LLaMA 2。

目前國內大模型還處在誰先發完全開源的大模型,大家一擁而上的狀態。我們去年12月份發布大模型之后,利用我們的大模型做研發的企業特別多。我覺得這是很正常的事。

但我認為開源的本質是為了構建一個良好的生態,讓更多的中小企業能夠在我們的大模型上開展一些工作。

AI科技評論:現在老生常談的一個話題是,開源怎么掙錢?

方漢:做開源的話,一開始大家確實不知道怎么掙錢。其實開源怎么變現已經有一套很成熟的邏輯了。最近MongoDB提出了一個新的邏輯SSPL,他說我開源出來,你可以隨便用,不用給我交錢。但是云廠商不能用這個給別人提供服務。包括百度、阿里、亞馬遜等云廠商,如果要給別人提供服務的話,必須付費。

但是因為云計算是一個大的趨勢,大家都希望云廠商來提供服務。MongoDB的說法是云廠商不許用,只能我來提供云服務,相當于把云服務的版權卡死了。只有他們能夠提供這項服務,這樣就會很掙錢,像MongoDB每年都有幾十億的營收。(更多關于大模型行業的故事,歡迎添加微信 ericahss1224,互相交流,互通有無)

AI科技評論:內部產品是在天工閉源大模型上做的,還是在開源模型上做的?

方漢:是在天工底座大模型之上,裁剪出的各種專有小模型上研發的。

大模型落地:早期蓬勃發展,且雜亂

AI科技評論:您認為大模型想要落地難嗎?

方漢:大模型在B端的落地速度會非常快。因為有些B端企業,尤其是國企、世界500強企業的付費習慣極好。很多人說大模型能不能在B端掙錢,就看微軟的股價什么時候漲。因為現在全世界做B端生意的,微軟是走的最好的。

國內的話,要看怎么激發用戶的痛點,比如我們做商品圖片生成,目前很多小企業、淘寶商家的付費意愿都很強,因為他們找淘寶模特拍一張商品圖片的成本可能是200塊錢到500塊錢,AIGC 2塊錢到5塊錢就能解決,所以淘寶模特和攝影師未來肯定會失業。

AI科技評論:所以不存在大模型商業化落地難的問題了?

方漢:當然存在,因為現在大模型的能力遠遠不夠,他能幫用戶解決的問題也是有限的。

為什么淘寶的商品圖片生成會率先被打破,比如一個身穿大衣的模特,多了根手頭,少了根手指頭,用戶是能容忍的,只要簡單地修一下就可以了。但如果是法律問題,你告訴我這個人應該從判3年改到判10年,這就是一個大問題了。所以想要在金融、法律、醫療等比較嚴肅的行業落地還是有難度的。內容賽道就比較容易了,比如漫畫畫錯了就畫錯了,大家在這方面的容忍度還是很高的。

現在大模型商業化還處在早期蓬勃發展且比較混亂的階段,但這是任何一項新技術發展的必經之路,如果一開始不雜亂的話,怎么能優勝劣汰出現一批真正優秀的公司呢。所以說這是一個很正常的現象。

AI科技評論:您認為哪些行業比較容易落地,哪些困難?

方漢:容錯率低的行業最難進,容錯率高的行業很容易進。

AI科技評論:三年以來,對大模型有沒有一個改觀?

方漢:大模型的智能能力越來越強,這是我們一開始想不到的,但我認為還有很多所謂的局限性。比如智能程度沒有那么高,最難的像3D模型的生產、以及視頻生成技術還沒有完全解決。

我們堅信未來一定會解決,但對于中小企業來說,不能等這些問題都解決了再研發產品,而是要提前做好準備。

AI科技評論:怎么平衡天工大模型和上層AI產品的關系,未來會有所側重嗎?

方漢:首先一個是基礎架構,一個是上層應用,沒有所謂的偏重。

目前大部分應用廠商沒有自己的大模型,只能調用別人的API,這就會出現很多風險。比如出現問題時只能先向上反應,等別人來改。再比如LLaMA是一個英文模型,它的中文語料不夠,所以想要做中文的很難。

好處在于,從大往小做容易。我們能基于底座大模型定制各類行業模型,加上對大模型有著深刻的認知和理解,也能加快做行業模型的進度,無論這個模型的質量是不是行業內最好的。

AI科技評論:未來競爭會愈演愈烈,怎么保持競爭優勢?

方漢:我們公司相對比較小,部門間的溝通會比較多。所以我們對于大模型的研究會朝著離應用更近的方向運行。

大模型的未來:端側推理將成為下一個爆發點

AI科技評論:目前國內大模型的發展歸于平淡了,您怎么看?

方漢:很大程度上是因為算力吃緊。訓練GPT-3.5只需1000張卡,GPT-4需要5000張卡起步。GPT-5估計要3萬張卡左右。算力不夠很難訓出下一代模型。這是很實際的問題。

所以以前是千模大戰,現在已經變成百模大戰了,未來可能會變成十模大戰,我對我們的大模型還是很有信心。

AI科技評論:您認為在這波大模型和AIGC浪潮中,最受益的是誰?

方漢:第一波受益的肯定是賣鋤頭的企業,比如做顯卡或者硬件的廠商,下游做光模塊、高速網卡的廠商都會從中受益。

AI科技評論:通用大模型、行業模型以及應用層的難度一樣嗎?分別體現在哪些方面?

方漢:我覺得不一樣,通用大模型的難點在于訓練成本和技術積累。行業模型的難點在于能否拿到某個垂直行業的專屬數據。比如法律文本,有一部分原來公開過,但并不是所有人能拿到所有的判定文本,這就是專有數據。

上層應用考驗的則是對行業以及產品形態的理解。現在業內有一個普遍的現象,所有的產品經理都是蒙的,不知道用AI做什么產品。而所有做技術的人都在講AI有多先進,你們可以發現做演講的都是技術人才,很少有產品經理出來講我用AI做了一種新的商業模式,但實際上真正有威力的是誰能夠基于AI創造出新的顛覆式的商業模式。

每個層面的難點不一樣,最簡單的反而是底層大模型,因為只要你有算力,有積累,就一定能做好。

AI科技評論:昆侖萬維最近收購了一個芯片廠商,是為了自己做訓練用?還是有其他考量?

方漢:模型訓練可能還早一點。但有一個問題,現在端側算力不夠,就是手機上不夠。vivo前段時間發布了一個模型,高通發布了一個能在手機上跑的芯片。所以我們認為端側推理會成為一個大趨勢。尤其是手機。現在手機賣不動了,為什么?因為攝像頭和顯示屏已經卷完了,4G、5G也卷完了,之后大家不知道卷什么了,下一波換機潮一定是AI換機潮,就是端側推理,因為端側推理是不需要付錢的,這些錢已經包含在了你買手機的錢里,比如買手機能一口氣買斷了多少年的推斷成本。

AI科技評論:也就是說端側推理,會成為下一波大潮?

方漢:對,下一個爆發點一定是端側推理。就像短視頻為什么能起來?是因為4G加攝像頭都卷到了一個臨界點,短視頻起來和4G、攝像頭的卷有密不可分的關系。

AI卷到最后一定是端側推理出來后會出現各種驚艷的功能。而且最后所有手機廠商都會拼命營銷,今天你的手機能跑30B,明天我的手機能跑50B,是不是跟卷攝像頭一模一樣?這是我們的一個認知。其實這對行業是一種好事,會倒逼廠商訓練7B、13B等小模型。

()

Tags:
相關推薦
免責聲明
本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。 交易和投資涉及高風險,讀者在采取與本文內容相關的任何行動之前,請務必進行充分的盡職調查。最終的決策應該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產生的任何金錢損失負任何責任。

熱門文章