首頁 > AI資訊 > 最新資訊 > 科技投資人|云啟資本陳昱:大模型研發創業公司是無畏無懼的

科技投資人|云啟資本陳昱:大模型研發創業公司是無畏無懼的

新火種    2023-10-31

人工智能初創公司OpenAI研發的聊天機器人ChatGPT橫空出世,引發了世界關注,也激發了產業和金融界討論和布局的熱潮。原本遠在天邊的通用人工智能(AGI)仿佛已經離人類越來越近。近日,云啟資本合伙人陳昱接受澎湃科技記者采訪,介紹了ChatGPT背后產生的質變,以及AI產業面向通用人工智能之路的未來。

陳昱長期關注前沿科技、智能駕駛等領域的投資,在加入云啟前曾任Google(谷歌)工程師、國內上市公司CTO(首席技術官)。他認為,ChatGPT背后的質變,其實并不是技術上的變革,而是工程上的創新,模型參數量規模擴大導致的質變,人工反饋是ChatGPT脫穎而出的根源。伴隨ChatGPT商業落地場景的顯現,前往通用人工智能的方向也逐漸清晰,雖然抵達終點的路程還很遙遠。

人工反饋是ChatGPT脫穎而出的根源

“有多少人工智能就有多少人工”,陳昱說,“這句話已經不是行業內的秘密。”訓練大規模語言模型,需要大量人工做數據清洗和標注,還需要得到人工反饋,使得語言模型更貼近人的語言習慣和擁有正確的價值觀。

自然語言處理技術(NLP)早在上世紀50年代便已進入科學家的研究視野,2010年后,計算機算力的大幅增長和深度學習的技術加持讓NLP奠定了如今的技術發展方向,“模型參數量上去以后,突然間質變就到來了。”陳昱介紹,除了參數量的提升,“人工反饋強化學習(RLHF)”的技術對語言模型質量的提升也起到了關鍵的作用,它使得語言模型能夠學習人類的表達方式。

人工反饋是ChatGPT脫穎而出的根源。用強化學習訓練來逐漸改進AI 模型,就像教小孩學習,做對獲得獎勵,做錯接受批評,經過無數次正負反饋迭代后最終讓模型收斂,接近人類期望的結果,而這背后需要極為大量的人工勞動。因此,ChatGPT選擇了勞動力價格低廉的非洲和東南亞,雇傭當地員工進行數據標注。其中肯尼亞數據標注員高強度的工作時薪僅2美元,也引發了國際社會的關注。

目前成本是傳統搜索的5-10倍

“AI大模型是躺在錢堆上的賽道。從買算力,到頂尖AI工程師的雇傭,再到數據的收集、標注和評估(反饋),都需要大量的資金投入。”陳昱介紹,“起步創業的話5000萬美元是夠了,但如果長期來說,融資量得到3-5億美元這個規模,才能叫真正上了牌桌。”他補充道,“這和當年的自動駕駛很像,對融資的要求特別高。”

ChatGPT背后的大模型不但擁有高昂的訓練成本,其推理成本亦不容小覷。陳昱介紹說,“現在ChatGPT每服務一次客戶要花費傳統搜索5-10倍的成本,這筆賬能不能算過來還是個問題。”

但陳昱同時也表示,成本的降低同樣也已經能夠展望,首先能夠確認的就是,摩爾定律在大模型的算力中同樣也有作用。“英偉達的GPU從V100、A100到下一代的H100,每次算力的整體效能都提高了一個數量級,所以未來成本還會繼續往下走。”陳昱介紹,“現在業內已經在實驗各種降低成本的方式,包括從芯片算力、改進算法等,還會研究未來是不是真的需要這么大的一個參數量,可能100億參數、500億參數的模型效果就很好了。”據他了解,微軟和ChatGPT整合后,用的模型也不是最大的千億級參數模型,而是一個中等大小的模型,只有幾百億的參數量,這些都會大幅降低模型的推理成本。

傳統大廠VS創業公司

在陳昱看來,對大模型公司而言,數據量非常重要,但創業公司同樣擁有在市場上挑戰大廠的機會。OpenAI取得的成績挑戰了Google在搜索引擎領域的商業模式,更是為人們津津樂道。

“互聯網上的數據對所有玩家都沒有區別,區別在于數據背后的人工反饋。”陳昱介紹,“創業公司肯定沒有大廠那么多的數據量,但它可以有一些創新的方式來收集數據和反饋,比如ChatGPT的聊天服務,其實用戶每一次和他的對話都會被記錄下來,它就在這樣的對話反饋中學習。”

另外,陳昱也認為,大語言模型的研發中,創業公司的靈活性讓他能比大公司做的更好。“如果是大公司里的一個部門,就會有大公司病帶來的一系列弊端。如果一個大公司想去推出一個類似的服務,肯定公司內部會有人跳出來說你這個模型做的不完美,出去會損害公司品牌,或者說你會挑戰我們已有的商業模式……無數理由讓它做不下去,但在創業公司我就是無畏無懼的。”

早在2021年底,云啟作為唯一的早期投資機構參與了國內一家多模態AI大模型創業公司MiniMax的天使輪投資。陳昱透露,目前MiniMax首款to C(面向消費者客戶)的產品Glow已近500萬用戶,“在商業層面,MiniMax可能是國內第一個基于用戶反饋跑通大模型的公司。”

商業化之路逐漸清晰

在陳昱眼中,ChatGPT已經擁有了很多商業落地場景,尤其是在和人的語言能力有關的領域。

“to C領域(面向個人)如情感陪伴,to B領域(面向企業)如智能客服、語法校對、文章摘要、財經分析等,這些都是大語言模型擅長的東西。”陳昱介紹,“當然目前它更多還是為人類提效。現在的人工智能、包括機器人都不能完全替代人類,未來很長一段時間都會是人機協同。”

通用人工智能(AGI)是人工智能發展的終極目標,即能夠達到一般人類的智慧,能夠執行人類智力水平的任務。而ChatGPT是通用人工智能的研究發展中產生的階段性成果。

“現在的研發進展比想象的快,也讓大家一下子找到了前往通用人工智能的一個方向,雖然這個方向具體能走多遠不清楚,但它是有階段性成果,而且是能商業化的。”陳昱表示。“通用人工智能現在仍然是一個遙遠的概念,我們也不知道是5年、10年還是100年后才能做到,所以團隊除了有技術之外,真的要有理想、有情懷。”陳昱表示,“作為VC(風險投資人)本身也需要理性的理想主義,除了資金助力之外,要真正去支持那些比較宏大的理想,不然不管是ChatGPT還是其他創新,就永遠不可能發生。”

相關推薦
免責聲明
本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。 交易和投資涉及高風險,讀者在采取與本文內容相關的任何行動之前,請務必進行充分的盡職調查。最終的決策應該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產生的任何金錢損失負任何責任。

熱門文章