楊植麟:選擇創(chuàng)業(yè),是為了從「組織架構(gòu)」上解決AI落地難題
在剛剛過去的2021年里,中國人工智能界最受人矚目的一件事,莫過于被譽為「AI四小龍」之首的商湯科技在香港聯(lián)交所成功上市,成為「中國AI第一股」!
對于許多正在奔跑的「AI科創(chuàng)家」來說,這無疑是一個振奮人心的消息——它讓人們看到,AI創(chuàng)業(yè)并非登不上臺面的兒嬉戲語,也全非「寒冬」一說。早年間創(chuàng)立的「AI四小龍」,在摸爬滾打中嘗到的,也不僅是開辟AI產(chǎn)業(yè)化的苦果,還有AI落地先鋒的甜頭。
2018年「深度學(xué)習(xí)三巨頭」Yoshua Bengio、Yann LeCun與Geoffrey Hinton獲得圖靈獎后,人們普遍認(rèn)為,未來十年,人工智能領(lǐng)域不會再出現(xiàn)重大的理論突破;相反,人工智能的發(fā)展將越來越多地體現(xiàn)在AI技術(shù)的應(yīng)用及其與產(chǎn)業(yè)的結(jié)合上。
換言之,「AI 能賺多少錢」成為了新的關(guān)注點。而隨之出現(xiàn)的,是越來越多的AI創(chuàng)業(yè)公司。
與老一輩以「AI四小龍」為代表的80后創(chuàng)業(yè)者相比,新一代的90后青年科學(xué)家在AI創(chuàng)業(yè)上有些許不同之處。
比方說,投資環(huán)境。老一代頻頻趕上AI投資熱潮,而隨著深度學(xué)習(xí)的瓶頸突現(xiàn)、AI技術(shù)成果轉(zhuǎn)化難等等問題的出現(xiàn),新一代創(chuàng)業(yè)者在找錢的問題上越來越多地遇到投資者的質(zhì)疑與防備,同時也面臨越來越多的競爭對手。
技術(shù)發(fā)展上,原先AI的落地集中在感知智能上,后來AI兼并了更多領(lǐng)域的知識(圖形學(xué)、統(tǒng)計學(xué)、強化學(xué)習(xí)、演化計算等等),新一代科學(xué)家的創(chuàng)業(yè)方向也開始更加多元化。除了計算機視覺,還有語音識別、自然語言理解、圖形學(xué)、芯片……
為此,我們策劃了「AI科創(chuàng)家」系列,邀請年輕一代的AI創(chuàng)業(yè)者與我們分享他們的創(chuàng)業(yè)故事。第一位創(chuàng)業(yè)者,是一位在學(xué)術(shù)界與工業(yè)界均十分有名的90后青年學(xué)者,他就是循環(huán)智能(Recurrent AI)的聯(lián)合創(chuàng)始人、Transformer-XL與XLNet一作楊植麟。
1、「激進」的AI落地法
「我想有一條更激進、更徹底的路徑去打破學(xué)術(shù)界與工業(yè)界的壁壘。」被問及創(chuàng)業(yè)的原因時,楊植麟這樣答道。
在投資人的眼里,楊植麟與循環(huán)智能的其他創(chuàng)始人一樣,有一份絕對拿得出手的光鮮履歷:
本科就讀于臥虎藏龍的清華大學(xué)計算機系,師從IEEE Fellow唐杰,2015年以年級第一名的優(yōu)異成績畢業(yè);
隨后,赴自然語言處理(NLP)研究全球排名第一的卡內(nèi)基梅隆大學(xué)語言技術(shù)研究所(LTI)攻讀博士,師從知名學(xué)者Ruslan Salakhutdinov與William Cohen;
博士期間,他與圖靈獎得主Yoshua Bengio合作發(fā)布「火鍋問答」數(shù)據(jù)集HotpotQA,又以一作身份發(fā)表的 XLNet 與 Transformer-XL在NLP領(lǐng)域產(chǎn)生重要影響,成為 NeurIPS 2019 與 ACL 2019 的最高引論文之一,谷歌學(xué)術(shù)引用次數(shù)直接破萬……
圖注:楊植麟的谷歌學(xué)術(shù)論文被引主頁
一般來說,卡內(nèi)基梅隆大學(xué)計算機專業(yè)的博士生往往要經(jīng)過六年的學(xué)習(xí)才能畢業(yè),而楊植麟只用了四年(2015-2019)就從CMU出師,一度成為學(xué)術(shù)圈的風(fēng)云人物。
作為一名佼佼的青年AI學(xué)者,楊植麟確定自己志在推動人工智能技術(shù)在現(xiàn)實生活中的大規(guī)模應(yīng)用。
一般來說,年輕博士生參與技術(shù)落地的途徑是進入資金雄厚、牛人云集的大廠,在其中謀得一官半職,比如他的兩位博士導(dǎo)師Ruslan Salakhutdinov與William Cohen并分別在搞學(xué)術(shù)之余擔(dān)任蘋果 AI 研究負(fù)責(zé)人與谷歌首席科學(xué)家。
但楊植麟認(rèn)為,「科學(xué)家加盟大廠」的模式在組織架構(gòu)上存在局限性,并不能令他更深入地參與到AI落地中,也無法從根本上解決工業(yè)界進行AI落地的瓶頸:
「我覺得AI行業(yè)面臨的共同問題是學(xué)術(shù)界與工業(yè)界之間的Gap。我們看到老師們在工業(yè)界有一些title,但其實本質(zhì)上他們還是在做研究工作。基礎(chǔ)研究固然重要,但無法打破這種壁壘,研究內(nèi)容與實際落地之間還有很多步驟。」
具體的表現(xiàn)有:一,高校教師往往更偏向?qū)W術(shù)研究,與工業(yè)界的聯(lián)系較少,也缺少工業(yè)界落地的思考與驅(qū)動力;二,與此同時,雖然許多互聯(lián)網(wǎng)大廠也會招入杰出的科學(xué)家去解決技術(shù)難題,但它們的首要出發(fā)點是賦能業(yè)務(wù),而非推動AI落地。
從大廠運作的組織架構(gòu)上來說,這些杰出的科學(xué)家沒有足夠的資源或權(quán)利去推動產(chǎn)品落地。公司的業(yè)務(wù)方向會調(diào)整,即使科學(xué)家有意愿去推動一項產(chǎn)品的落地,成本與代價也會大幅增加,技術(shù)的轉(zhuǎn)化率與效率也會受到企業(yè)組織架構(gòu)的影響。
在楊植麟看來,這是一個非常大的限制,這也造成了在大廠中,許多AI技術(shù)的落地周期十分漫長,也不夠敏捷。因此,2019年博士畢業(yè)時,他拒絕了谷歌、Facebook與華為等大廠的高薪offer,選擇了回國創(chuàng)業(yè)。
圖注:楊植麟與兩位博士導(dǎo)師Ruslan Salakhutdinov(最右)、William Cohen(最左)合影「創(chuàng)業(yè)的好處是我們可以自己決定公司的組織架構(gòu)。人生苦短,精力有限,優(yōu)化公司的組織形式可以有效減少中間損耗,縮小技術(shù)轉(zhuǎn)化與社會價值之間的距離。」楊植麟談道。
楊植麟對AI科技評論回憶,他的本科與博士導(dǎo)師都十分看重技術(shù)的實際價值,這給他帶來了很大的啟發(fā)。不同的是,他會更激進地去追求落地的結(jié)果,深入業(yè)務(wù)中進行研究。他的計劃是同時進行學(xué)術(shù)研究與技術(shù)落地,并同時取得成果。
循環(huán)智能成立于2016年。也就是說,楊植麟從博士二年級開始就一邊搞學(xué)術(shù)研究、一邊創(chuàng)業(yè)。
正是有感于「大廠科學(xué)家」的尷尬處境,他一直強調(diào)「我們需要新的思考」。在循環(huán)智能,他不僅是AI技術(shù)負(fù)責(zé)人,還是產(chǎn)品經(jīng)理,這無疑是一個「范式層面的革新」,是他心中能夠有效打破技術(shù)與價值之間壁壘的最優(yōu)途徑:
「一方面,我們會去做基礎(chǔ)的研究,如預(yù)訓(xùn)練、多模態(tài)等;另一方面,我們也要去進行落地。這兩個事情可以互相提升與促進。」
2、研究與落地,雙輪驅(qū)動
循環(huán)智能最早的三位創(chuàng)始人陳麒聰、楊植麟與張宇韜相識于清華大學(xué)的知識工程實驗室,都有一股「用AI創(chuàng)造社會價值」的熱血。三人都是技術(shù)出身,后來因為業(yè)務(wù)發(fā)展,循環(huán)智能在2018年又引入了另一位擅長技術(shù)產(chǎn)品運營的「第四把手」揭發(fā)。
自成立以來,楊植麟就是團隊的核心技術(shù)骨干。2016年與2017年,他與陳麒聰、張宇韜開始摸索技術(shù)的應(yīng)用方向。
對新一代AI創(chuàng)業(yè)者來說,2017年是一個重要的時間節(jié)點。
那一年,谷歌團隊在“Attention is All You Need”一文中提出Transformer模型,該模型沒有采用卷機網(wǎng)絡(luò)與以往RNN的時序結(jié)構(gòu),采用編碼機制,編碼端同時包含語義信息(Multi-Head Attention)和位置信息(Positional Encoding),能夠并行計算,大大提升了語言模型的訓(xùn)練速度。
對于專注技術(shù)落地的創(chuàng)業(yè)者來說,這無疑是一項利好消息,能夠減少預(yù)訓(xùn)練的時間,節(jié)約研發(fā)成本,加速技術(shù)與場景的匹配速度。Transformer的出現(xiàn),打破了計算機視覺憑借深度學(xué)習(xí)在AI創(chuàng)業(yè)圈一統(tǒng)天下的壟斷局面,使一大批基于NLP技術(shù)的創(chuàng)業(yè)公司開始嶄露頭角,循環(huán)智能便是其中之一。
循環(huán)智能的主要業(yè)務(wù)是運用NLP、語音、多模態(tài)、大模型等人工智能技術(shù)打造「銷售科技」方案,幫助企業(yè)的銷售團隊提升銷售業(yè)績。
楊植麟談道:「我們認(rèn)為,AI產(chǎn)生價值的過程可以分為幾個階段,而其中一個階段就是幫助每個人變得更好,提升人的能力,從而提升整個社會的運行效率。這個Vision(愿景)是我們公司成立之初就有的想法。」
據(jù)他介紹,循環(huán)智能選擇將AI用于「提升人的溝通能力」,也是經(jīng)過了很長時間的探索,與客戶交流、不斷迭代才確定。最終,他們抉擇的原動力是客戶的訴求,以及對整體市場的判斷。比如,根據(jù)CB Insights的數(shù)據(jù)統(tǒng)計,2016年銷售科技初創(chuàng)企業(yè)的投資額就超過了50億美元,此后逐漸遞增。這也表明了市場對這個賽道的信心。
圖注:Gartner的銷售科技(SalesTech)技術(shù)成熟度曲線2021顯示,銷售賦能一支已經(jīng)渡過「技術(shù)萌芽期」(Innovation Trigger),進入「期望膨脹區(qū)」(Peak of Inflated Expectations)
如前所述,楊植麟認(rèn)為,AI系統(tǒng)的組織架構(gòu)會影響產(chǎn)品的能力,而組織架構(gòu)的靈活設(shè)置可以幫助他們以一個更好的模式去推進產(chǎn)品落地。在創(chuàng)業(yè)的過程中,楊植麟實現(xiàn)了學(xué)術(shù)研究與工業(yè)落地的雙輪驅(qū)動模式。比方說,他被 ACL 2019 接收 Transformer-XL 一文,早在發(fā)表之前就已應(yīng)用在了循環(huán)智能的 ASR 產(chǎn)品中。
對于這項基礎(chǔ)技術(shù)的快速轉(zhuǎn)化,楊植麟引以為豪:
「在預(yù)訓(xùn)練的過程中,我們將技術(shù)部署在產(chǎn)品系統(tǒng)上,讓它能以實際數(shù)據(jù)集的運行效果為最終目標(biāo),驅(qū)動中間的研發(fā)過程。在將挖掘系統(tǒng)落地時,系統(tǒng)也是以最終的業(yè)務(wù)結(jié)果為目標(biāo)進行學(xué)習(xí)與優(yōu)化。同時,中間過程又可以迭代出很多AI問題與基礎(chǔ)技術(shù),使得之后的產(chǎn)品可以進一步改善。」
AI模型的落地中,一個常見的問題是數(shù)據(jù)集的真實性與完備性。
一般來說,研究者在改進模型時,往往是基于特定的、人工創(chuàng)造的數(shù)據(jù),但這些數(shù)據(jù)也許并無法完整、正確地描述模型在實際場景中遇到的情況。因此,盡管預(yù)訓(xùn)練的若干技術(shù)都已在學(xué)術(shù)界的許多數(shù)據(jù)集上得到了測試,且性能優(yōu)異,但在實際應(yīng)用中,卻仍需要非常多的技術(shù)改進才能部署落地,因為模型會遇到更多更復(fù)雜的問題。
目前,在解決這一問題上,學(xué)術(shù)界仍未有突出進展。但在創(chuàng)業(yè)的過程中,由于楊植麟與團隊的預(yù)訓(xùn)練技術(shù)研究從一開始就是在實際的數(shù)據(jù)集中測試,直接與AI產(chǎn)品框架匹配,因此,類似的落地問題便能從根拔起。
3、談?wù)劇窷LP+銷售」
除了2017年的Transformer,近年來,人工智能領(lǐng)域又涌現(xiàn)出了許多基于Transformer的大規(guī)模預(yù)訓(xùn)練語言模型,比如Bert與GPT-3。此外,還有許多新興技術(shù)對AI創(chuàng)業(yè)者產(chǎn)生了積極影響,比如少樣本與零樣本的研究突破。
從NLP技術(shù)落地的角度來看,這將是一個個革命性時刻。因為通過將這些研究成果有機結(jié)合,AI模型的效果與效率能夠得到大幅提升。在某些場景中,研究者甚至只需要通過非常少的樣本、甚至零樣本就可以取得跟以往一樣好的效果。
對于循環(huán)智能來說,這意味著,在用AI提升銷售轉(zhuǎn)化率的過程中,他們能夠做到很多以前做不了的事情,比如會話洞察與分析引擎。隨著NLP落地技術(shù)的逐漸成熟,加之企業(yè)服務(wù)在全球范圍內(nèi)成為新的投資熱點,楊植麟與團隊憧憬,通過「NLP+銷售」的路徑,循環(huán)智能也有成為「中國Gong.io」的可能。
具體來說,用人工智能提升銷售效率的過程可以分為三步:一是對銷售與客戶之間的會話數(shù)據(jù)進行采集;二,對有價值的會話內(nèi)容進行挖掘并建模,將非結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)為結(jié)構(gòu)化數(shù)據(jù);三,分析會話數(shù)據(jù),找出銷售人員在與客戶溝通的過程中存在的問題,更精確地分析客戶意愿,并給出解決問題的關(guān)鍵要素。
歸根到底,就是對大規(guī)模的文本數(shù)據(jù)進行高效分析。
聽來簡單,但事實上,「AI+銷售」是一條同時具備市場剛需與高技術(shù)壁壘特征的賽道,因為這要求AI系統(tǒng)具備綜合分析的能力, 除了算法,會話洞察能力、數(shù)據(jù)分析能力、行業(yè)營銷知識等等也缺一不可。這很符合循環(huán)智能創(chuàng)始團隊的創(chuàng)業(yè)風(fēng)格:既要創(chuàng)造價值,也要擁有一定的技術(shù)門檻,提高競爭難度,減少對手。
從剛需的角度來看,業(yè)績增長是每一家企業(yè)的發(fā)展根基。銷售作為市場營銷中的一環(huán),其會話流量的轉(zhuǎn)化率對業(yè)務(wù)目標(biāo)的影響至關(guān)重要。據(jù)楊植麟觀察,流量轉(zhuǎn)化率在許多行業(yè)中都是一個突出的痛點問題,尤其是金融行業(yè)。
他們曾接觸過一個國內(nèi)的頭部保險公司X,旗下有一家分公司Y。Y的銷售困境是:雖然Z的銷售團隊賣出了許多保單,數(shù)量遠(yuǎn)遠(yuǎn)高于X位于鄰城的另一個分公司Z,但所收的保費總和卻比Z要低。經(jīng)過分析,原因很簡單:因為Y的均件保費遠(yuǎn)遠(yuǎn)低于Z。
這時,他們需要通過分析手中已有的數(shù)據(jù),來找到拯救萎靡業(yè)績的方案。而回顧已有數(shù)據(jù),企業(yè)的唯一法寶,是保存了大量的溝通語音或文本數(shù)據(jù)。
對于計算機來說,未經(jīng)解碼的語音數(shù)據(jù)猶如黑盒,同時是非結(jié)構(gòu)化的。這時,NLP與語音技術(shù)的結(jié)合可以對這些非結(jié)構(gòu)化數(shù)據(jù)進行高效解析,并管理一個企業(yè)銷售團隊的溝通過程。換言之,此時AI產(chǎn)品還是一個「管理抓手」的角色,分析銷售人員與客戶的溝通情況,洞察客戶需求,提高銷售管理能力和銷售團隊的工作效率。
「我們提供的產(chǎn)品可以把每位銷售人員在每一天的開口率以非常清晰的、精確的方式呈現(xiàn)出來。它能定位到每一個團隊成員的每一通電話、每一次溝通,據(jù)此便可以做很多報表分析,從而知道每個團隊的問題在于何處。」楊植麟介紹。
圖注:循環(huán)智能AI產(chǎn)品的原理示意圖
根據(jù)實戰(zhàn)的結(jié)果,循環(huán)智能打造的AI系統(tǒng)每天可以處理超過 1 億次的對話數(shù)量,幫助Y將保單的均件保費提升了大約20%。目前,他們已與數(shù)十家銷售人員超過一千人的企業(yè)合作,主要覆蓋銀行、保險、房地產(chǎn)、汽車等四大行業(yè)。
楊植麟解釋:「這幾個行業(yè)都有一個共同的特點,就是對銷售技能的要求高,銷售過程非常復(fù)雜。同時,相對來說,這些行業(yè)有精細(xì)化運營的需求,它們的精細(xì)化程度達(dá)到了一定的閾值,足以支撐他們應(yīng)用AI系統(tǒng)來優(yōu)化效率。」
在這個過程中,他們的AI系統(tǒng)后臺也積累了數(shù)千個來自不同行業(yè)的語義模型,構(gòu)成了循環(huán)智能AI大腦的強大知識庫,有利于NLP模型的進一步落地。去年,他們與華為云合作,開發(fā)了大規(guī)模中文模型「盤古」,在部分實際場景中達(dá)到了優(yōu)于Bert與GPT系列的效果。
目前,循環(huán)智能已進行到B輪融資,連續(xù)三年實現(xiàn)了超200%的營收增長。不過,楊植麟談道,創(chuàng)業(yè)必須深入業(yè)務(wù):「我們現(xiàn)在還屬于將產(chǎn)品打磨成熟的階段,主要任務(wù)是擴展與提升銷售溝通場景的覆蓋面。」
4、創(chuàng)業(yè)感想
楊植麟認(rèn)為,決定一家技術(shù)創(chuàng)業(yè)公司是否能立足的兩個因素,一是具備多維度的綜合能力,二是深耕行業(yè),能夠?qū)⑼ㄓ卯a(chǎn)品與細(xì)分的行業(yè)方案進行有機結(jié)合:
「當(dāng)我們擁有了一個通用的技術(shù)品牌后,我們可以用較低的邊際成本將其擴展到新的行業(yè)、新的公司與新的細(xì)分場景中。因此,我們需要一個成為『行業(yè)專家』的團隊,能夠提供專業(yè)的行業(yè)方案,再用這個專業(yè)方案包裝產(chǎn)品,進行落地。」
循環(huán)智能擁有明星創(chuàng)始人團隊,在吸引綜合人才方面并不難。楊植麟也強調(diào),打造用于提升銷售的AI系統(tǒng)并不能僅靠一群「NLPer」或「CSer」的力量,還需要有硬件人才、營銷人才、行業(yè)分析師等等。
在科技賦能數(shù)字經(jīng)濟的進程中,NLP的核心價值往往體現(xiàn)在最后一公里。對于任何行業(yè)來說,只要有溝通數(shù)據(jù)與文本數(shù)據(jù)的場景,NLP技術(shù)就可以發(fā)揮價值。傳統(tǒng)的NLP場景最大的瓶頸是規(guī)模化,但隨著Transformer、少樣本/零樣本學(xué)習(xí)等研究的突破釋放了極高的邊際價值,楊植麟相信,在未來幾年,NLP的規(guī)模化賦能將成為可能。
創(chuàng)業(yè)五年,楊植麟總結(jié)了自己在技術(shù)以外的成長:一是有機會學(xué)習(xí)到商業(yè)邏輯,加深了對行業(yè)與場景的認(rèn)知;二是學(xué)習(xí)到如何建立與運營一家公司;三則是能有一種更徹底的方式縮短了技術(shù)與價值之間的鴻溝。
十年前,也許很多人會認(rèn)為,進入大廠才是研究實用AI的最佳途徑。但隨著近一兩年來越來越多的技術(shù)大牛從互聯(lián)網(wǎng)大廠離職,或回歸學(xué)術(shù)界,或自主創(chuàng)業(yè),人們開始意識到:要推動人工智能技術(shù)的大規(guī)模落地,需要一種新的運作模式。從這點來看,楊植麟的選擇頗有先見之明。
據(jù)了解,目前,楊植麟除了在循環(huán)智能創(chuàng)業(yè),同時也在清華大學(xué)、智源研究院等機構(gòu)主導(dǎo)了多個AI研究項目,繼續(xù)踐行他對如何打破研究與應(yīng)用之間壁壘的思考。在創(chuàng)業(yè)與學(xué)術(shù)的雙輪驅(qū)動下,楊植麟等新一代實干家,給中國人工智能的未來帶來的不僅是「激進」的應(yīng)用,還有培養(yǎng)從研究端就開始思考技術(shù)轉(zhuǎn)化的青年人才。
薪火相傳,未來可期。
參考鏈接:
1.https://www.gartner.com/en/documents/4004056/hype-cycle-for-crm-sales-technology-2021
2.https://mp.weixin.qq.com/s/huaJLRecOoV-gWzL0ZjEAQ
- 免責(zé)聲明
- 本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應(yīng)被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認(rèn)可。 交易和投資涉及高風(fēng)險,讀者在采取與本文內(nèi)容相關(guān)的任何行動之前,請務(wù)必進行充分的盡職調(diào)查。最終的決策應(yīng)該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產(chǎn)生的任何金錢損失負(fù)任何責(zé)任。