首頁 > AI資訊 > 最新資訊 > 前阿里大數據中心高管、天壤CEO薛貴榮:AI將沖擊所有行業人類要學會和機器一起工作|連線創始人

前阿里大數據中心高管、天壤CEO薛貴榮:AI將沖擊所有行業人類要學會和機器一起工作|連線創始人

新火種    2023-09-21
《安安訪談錄》是界面執行總裁徐安安出品的一檔深度訪談類欄目。從投資角度對話1000位行業領軍人物,覆蓋傳媒創新、VC/PE、信息服務、金融科技、交易體系、戰略新興等方向。科創板日報《連線創始人/CEO》是由《安安訪談錄》出品的針對創新創業型未上市企業創始人的訪談欄目,以企業創始人/CEO的訪談為一手信源,讓成長中的創業公司走入公眾和市場視野,并發掘最新技術和產業趨勢。

image

本期訪談人物:

天壤創始人兼首席執行官 薛貴榮

“在一些基礎工作被AI替代的同時,也會衍生諸如人工智能培訓師等新興行業。當前中國版ChatGPT要實現追趕,最大的挑戰在于追趕時間差。”

▍個人介紹

天壤創始人兼首席執行官,人工智能與大數據領域科學家,國家科技部云計算專家組成員,原阿里媽媽首席數據科學家。首批全國優秀博士論文獎獲得者,國內第一位在全球搜索領域頂級會議ACM SIGIR上發表論文的科學家,全球遷移學習領域開創者和深度強化學習頂尖專家。薛貴榮博士曾在世界頂級會議NIPS、ICML、SIGKDD、SIGIR、WWW與世界頂級刊物ACM TOIS、ACM TIST等發表論文70余篇,擁有專利十余項,論文引用達9000+。

▍第一標簽

國內深度強化學習領域開拓者

▍公司簡介

天壤成立于2016年,是專注于通用智能研究(AGI)的創新企業,致力于解決人工智能的可用性和易用性問題,實現以最小成本、最快速度賦能業務場景,讓智能像水電煤一樣便捷。

目前,已經廣泛地服務于城市運行、交通治理、金融保險、商業零售、生物科技等場景。希望為人類社會的可持續發展帶來突破性進展,讓社會更便捷、更聰明、更智慧。

image

在2016年創立天壤之前,薛貴榮曾就職于阿里巴巴,先后任職阿里媽媽大數據中心負責人、阿里媽媽首席數據科學家等職務,負責研發了阿里搜索引擎等平臺。

作為上海交通大學計算機系副教授,薛貴榮的研究方向主要為機器學習、信息檢索、互聯網營銷、大規模數據分析和分布式計算,在世界頂級會議NIPS等發表論文70余篇,擁有專利十余項。

談及當下ChatGPT所引領的人工智能熱潮,薛貴榮認為未來兩年,會看到AI應用的極度爆發,人工智能技術將廣泛、深刻地改變各行各業,并將帶來人機交互方式的巨大變革,所有的應用和平臺要基于ChatGPT框架重新開發。

“在一些基礎工作被AI替代的同時,也會衍生諸如人工智能培訓師等新興行業。當前中國版ChatGPT要實現追趕,最大的挑戰在于追趕時間差。”薛貴榮說。

01——————————做中國版ChatGPT 算法創新和高質量的數據缺一不可

對于ChatGPT熱潮背后的推動力,薛貴榮認為,首先是算力的提升,其次是算法的躍遷。Transformer把自然語言模型的上下文之間關系的學習能力,提升了新的臺階。

“過去基于卷積的神經網絡依賴大量數據,通過一層一層網絡的學習,掌握如何把一個概念與另一個概念相關聯。但這種方式傳遞過程中往往容易產生信息的丟失。Transformer模型出現后,針對某兩個概念,機器可以更迅速、準確地建立關系的連接。這種方式更接近于我們人類解決問題的方式,可以考慮更復雜的事情。

同時,ChatGPT引入了強化學習機制,加速推動了通用人工智能的發展。

“在過去,標數據是一個很困難的事兒,特別是標這么大的規模。如今的ChatGPT基于大模型學到的知識,并通過人類的反饋進行訓練優化。通過人的指導,不斷告訴AI,這么回答是錯的、這么回答是很有條理的。讓AI盡可能地掌握與人類進行溝通的‘技能’,以保證AI能夠像人類一樣思考和回答問題,并和人類保持相似的價值觀。”

隨著ChatGPT帶動人工智能產業成長,引起新一輪全球科技競賽。中國的ChatGPT究竟該如何追趕?薛貴榮表示,國內廠商要不惜代價地迎頭追趕,現在最重要的是追趕時間差。ChatGPT的智能化程度指數級增長且與日俱增。其最終的迭代信息差和發展高度決定了我國與國外的平均智商差。

“大模型近幾年持續火熱,ChatGPT能夠脫穎而出的根本原因是強化學習技術的創新和高質量數據積累的疊加效應。第一,只有基于深度強化學習體系,模型才會有更好的反饋機制和價值判斷標準,才能掌握更多優質數據和答案,才更逼近人類智能。第二,只有對語料數據的抓取足夠充分,實現規模、深度、廣度的全覆蓋,才能提升高質量數據密度,訓練出好的大模型。要實現中國的ChatGPT大模型,這兩點缺一不可,而國內廠商目前在這兩方面的探索還有較大提升空間。”

在模型方面,自然語言處理的兩大路線分別為谷歌BERT和OpenAI的GPT系列,兩者一直處于競爭狀態。此前,BERT模型的表現更好,也導致國內企業大多追隨的是谷歌BERT路線,國內的模型面臨技術路線的調整。

02——————————每個人都將擁有AI大腦

作為國家科技部云計算專家組成員,薛貴榮是國內第一位在全球搜索領域頂級會議ACM SIGIR上發表論文的科學家。之后,也曾加入阿里巴巴,負責研發阿里全網搜索引擎。

2016年離開阿里創立天壤后,薛貴榮堅定了通用人工智能的探索道路。“讓每個人都有一個AI大腦,是我們一直以來所堅持的方向,也是我們最大的目標。”

迄今,薛貴榮帶領團隊先后在AI圍棋、交通、生物科技等領域開展探索,研發了AI圍棋TRGo、蛋白質結構預測系統TRFold,以及國內首個城市級交通調度系統TRTraffic、蛋白質設計TRDesign等多個大模型。

薛貴榮向《科創板日報》記者坦言,在創業過程中曾面臨中文版ChatGPT一樣的難題,即有標注的數據量不夠。如果沒有高質量的數據,很難把技術做深。為此,天壤很早地就在實踐中引入了基于強化學習的數據增強機制。

“我們做強化學習在國內是非常早的。2016年我們做AI圍棋的時候,用兩個機器人對抗的方法來生成大量的棋譜數據,并通過優勝劣汰的方式迭代優化模型。那時候我們就發現用強化學習對模型的效果提升作用非常巨大,這個發現對當時的我們來說非常震撼,也證明我們找對了路子。”

薛貴榮認為,生成高質量數據的能力是天壤的優勢。

“后來這套方法論我們在智能交通領域進行應用。路上的信號燈基本上都是靠人力調控,調地好壞沒有很客觀的評價標準。同時信號燈又涉及上下游路口聯調,流量24小時都在動態變化,要獲取訓練數據非常復雜。我們搭建交通模擬器來生成數據,通過強化學習不斷的進行模型的學習和數據生成,從而獲得高質量的交通信號燈調控模型。

薛貴榮透露,在做蛋白質研究時,同樣采用了強化學習來進行數據增強。“先用模型預測結果,然后再把預測好的數據投喂給模型訓練,用數據增強的方式讓模型質量有了大幅度的提升。經過幾個大的復雜場景的實踐,我們研究大模型訓練的路線越來越通用,也形成了統一的思路。”

“先預訓練一個大模型,然后用強化學習去‘教導’模型,讓模型生產出足夠多的新數據,進行‘自學習’。就像一個小孩對應一個教導老師,不僅學習知識,還學習方法,解決問題的能力就可以持續提升。這才能代表真正的人工智能。”薛貴榮總結。

從科學家變成創業者,薛貴榮直言這條路上確實荊棘重重。

“創業的關鍵,還是要有核心技術,并且靠核心技術能夠帶動商業。我覺得在國內,創業的門檻要足夠高,才能有機會。”

03——————————“這兩年AI應用會極度爆發,沖擊所有行業”

對未來人工智能的發展,薛貴榮表達了樂觀的態度。

“這兩年AI應用會爆發,而且會極度爆發。我覺得對所有的行業都會有沖擊。首當其沖是客服會被顛覆,普通的律師、財務、人力等工作可能也會被替代。以后,人類要學會和機器一起工作,這是競爭力所在。機器將承擔絕大部分基礎性的工作,人類主要做好‘指導’的角色,并把精力投入到更有創造性的事情上。”

在替代一些基礎工作的同時,AI也將催生新的行業,比如人工智能培訓師。

“AI生產內容的組織方式很重要。比如,讓AI提取財報的核心數據,需要依賴人類給他指令,告訴它重點是什么。將來會'提問題'是一項很重要的能力。你問的問題越有挑戰,越能持續幫助AI訓練,升級AI應用,AI回答問題也將更加準確、全面。這在未來幾年會是一個很大的行業。”

ChatGPT所引領的這波人工智能熱潮,也會帶來人機交互方式的巨大變革,所有的應用和平臺要基于ChatGPT框架重新開發。

“ChatGPT的成功不僅僅是新一代聊天機器人的突破,更是人工智能對整個信息產業帶來的革命,將帶來全要素生產率的極速提升。基于ChatGPT的全新的交互接口,所有的應用、平臺、軟件將全部重新開發,代替以往Windows視窗作業系統。”

薛貴榮進一步解釋,“現如今的所有界面可能都會被重構,最終將變成人類通過AI和數字世界進行自然語言交流。可以直接向機器發送指令,解決問題。人和數字世界的通道徹底被打通,AI將變得更加實用。你可以直接跟AI交流,來完成一個客戶email的回復,完成一個廣告策劃的文案,也可以完成會議的關鍵內容整理,獲取財報的關鍵數據。他會變成你個人的一個AI助手。越多的交流,他就會越能明白你的意圖,幫你解決各類問題。”

除了工作場景,行業和企業級的應用,也將被完全顛覆。“不再是傳統的交互方式,而是直接給AI下指令:把招聘需求、大量文稿翻譯,面試和財務報告的整理等等。”

當然,這背后都需要大模型的支撐。薛貴榮認為,未來模型會進一步細分,除了通用模型外,還會衍生針對不同細分領域的行業模型,以及企業內部模型、個人模型等等。

“總之ChatGPT讓我們看到大模型有希望實現通用人工智能。未來針對某個場景有Best Model(最佳模型),每個行業、每個企業都需要有一個ChatGPT,再結合個人模型。其中,個人模型里會包括你的基礎信息、喜好偏向等,便于AI更準確地為你提供個性化服務。”

相關推薦
免責聲明
本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。 交易和投資涉及高風險,讀者在采取與本文內容相關的任何行動之前,請務必進行充分的盡職調查。最終的決策應該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產生的任何金錢損失負任何責任。

熱門文章