為什么AlphaGo生在硅谷,而非中國?他說出了真實原因
AlphaGo擊敗人類,喚起世人對人工智能的關注,繼而在全球掀起人工智能大熱潮。
AlphaGo是怎么來的?
“Google一年的研發投入是120億美金,這是研發燒掉的,而不是整個公司的日常運營花費,正因為這樣,才會有AlphaGo、自動駕駛等技術。2014年谷歌就愿意付6.6億美金買一個小初創公司,這個公司只有12個人,沒有任何的產品落地,就是用深度學習在玩游戲、下棋。他們會花這么高的價格來買這樣的一家公司。如果在我們中國的商業環境下,可能花幾百萬美金挖人就夠了,這樣肯定經濟效益更好。但是,就不會有后來的AlphaGo了。”
中國科學院深圳先進技術研究院副院長、香港中文大學教授、商湯科技創始人湯曉鷗8月30日在全球(上海)人工智能創新峰會上強調了這一點,峰會現場,他做了題為《人工智能的中國式文藝復興》的演講,強調了尊重原創的重要性。“他們愿意投入,就是對原創技術、對人才的尊重,才會有后面的AlphaGo。”
湯曉鷗曾發明人臉識別技術Gaussian Face,是世界上第一個超過人眼識別能力的計算機算法。早在1992年,在美國麻省理工學院攻讀博士學位的湯曉鷗開始接觸人臉識別的算法,獲得博士學位后,他先后在香港中文大學和微軟亞洲研究院工作,繼續從事計算機視覺相關領域的研究。2014年3月,湯曉鷗研究團隊發表了GaussianFace人臉識別算法。隨后,湯曉鷗的實驗室發布了更先進的DeepID算法,DeepID算法標志著人臉識別技術真正成熟。
對于當下的人工智能大熱潮,湯曉鷗提醒說,人工智能并不是件趕時髦的事,人工智能需要高尖端人才長期積累潛心研發,并不是剛畢業的本科生做個網頁那么簡單,人工智能并不適合互聯網式的“大躍進”發展,這是當下AI熱潮中需要注意的問題。

以下是湯曉鷗的演講內容:
感謝組委會的邀請,今天我要講的,想強調的就是兩個字,原創。
原創,需要長期的積累、大量的投入,而不是一夜之間突然我們就都可以原創了。
每次我講報告都會用我兒子的照片來開頭。以前我會講一些理由,比如他長得漂亮、或者是我以前用的人臉識別數據經常用他的照片做訓練等等。今天,我講原創,如何找理由聯系?昨天晚上想了想,我想,兒子是我和我太太唯一的原創,是真正的原創。
說到原創,可能大家最近都看了一個電影《戰狼2》,我還沒有看,很難評價它好還是一般。但大家知道,它的票房已經是53億(截止8月28日的數據),超過了《蜘蛛俠》《變形金剛》。這在十幾年前完全不可想象,而且排行榜當中很多的電影都是全球的票房收入,而《戰狼2》是靠中國一個國家的票房收入就做到了這點。可以做到這點有很多的原因,我不評價,因為沒有看過。但有一個必要的原因,就是兩個字:原創。
這個電影10多年前是否會發生?不會。那時候我們每個人花不到1美元,可以在大街上買到任何的好萊塢大片,不會花十幾美元去電影院看這個電影,那時候中國不會有好的原創電影。所以長期以來,我們沒有自己的頂級電影創作。最近這些年,大家對原創技術,對IP的尊重,對法律的維護,我們才會有《戰狼2》這樣的電影。
說到電影,中國的電影發源地就是上海。像20、30年代的時候,上海的電影發展好像并不落后于全球。當時我們在電影創作上,很多演員和導演都是非常非常有名。我也無法講他們為什么會做得那么好,一個必要條件還是對原創、對IP的尊重,所以當時才會發展得那么好。很高興,今天又開始恢復到那樣的時代,我們的電影又可以重新崛起了。
上海,不僅是中國電影文化的發源地,也是中國現代文化的發源地。比如中國的商務印書館,100多年前就創建了,也是標志著上海的現代文化的開始。當時有很多原創的東西,我們知道的一些文人大作家,包括魯迅等非常有名的學者,他們寫了很多的文章、小說,那時候如果他們沒有版權收入,相信他們也活不下去。原創也無從談起了。
再往遠一點看,今天我為什么要講文藝復興,14到17世紀它真正的起來,有政治的原因、宗教的原因,各種各樣的原因,但有一個必要條件,也是對原創的尊重。因為有了這些,才有了達芬奇、米開朗基羅、拉斐爾、莎士比亞等一系列非常優秀的藝術家和作家。
最后這張圖上的這個作品大家可能會有一些疑問,說文藝復興時候好像沒有見過這個作品,這是我非常欣賞的現代藝術家的現代藝術作品,這個作品叫“紙上談呯”,描寫的是一個憂郁的藝術家彈琴,坐在一卷手紙上,非常原創,和旁邊的米開朗基羅的“大衛”有異曲同工只妙。對不起,我實在編不下去了,其實這是我兒子的手工作品,主要還是想強調它的原創性,對手紙的應用很有創意。
下面來看一下今天的人工智能的原創,我們總是聽到Google的聲音,聽到AlphaGo、谷歌的自動駕駛等等,為什么總是聽到Google的聲音?一個原因是Google一年的研發投入是120億美金,這是研發燒掉的而不是整個公司的日常運營花費,正因為這樣,才會有AlphaGo、自動駕駛等技術。2014年谷歌就愿意付6.6億美金買一個小初創公司,這個公司只有12個人,沒有任何的產品落地,就是用深度學習在玩游戲、下棋。他們會花這么高的價格來買這樣的一家公司。如果在我們中國的商業環境下,可能花幾百萬美金挖人就夠了,這樣肯定經濟效益更好。但是,就不會有后來的AlphaGo了。他們愿意投入,就是對原創技術、對人才的尊重,才會有后面的AlphaGo。
Facebook也是2013年左右,深度學習剛剛起來沒多久,大量投入資金,組建深度學習實驗室。
Eric(麻省理工學院的名譽校長Eric Grimson)提到了Mobileye,英特爾愿意花150億美金收購這樣的公司,其實這個公司也沒有什么貴重的東西,就是一伙人,幾個教授帶一群學生做研究。他們花錢收購,而不是挖人。
大家都非常熟悉AlphaGo,在AlphaGo之前我和投資人講深度學習,沒有人愿意聽,也沒有投資人關心。但是這盤棋下完之后,投資人開始回過頭和我講什么是深度學習。AlphaGo在全球引起了巨大的轟動,因為圍棋這件事,是腦力勞動非常強的活動,機器可以戰勝人類確實看起來很了不起,但并不是說機器無比聰明,為什么機器可以下棋?是我們定義的任務,我們讓他做下棋這件事。他所做的訓練都是基于棋譜,所以他不會想控制人類這件事,他的任務是人類定義的。短期我們不用擔心,長期也不用擔心機器人控制人類這件事。AlphaGo真正轟動的意義是它的創新和深度學習的算法巨大的進步,這在全球引起了大量的報道。
緊接著谷歌在中國做了一個AlphaGo2,和柯潔下了一盤棋,也下得非常精彩,值得大家關注,也有一些新的技術出來。那周,中國媒體鋪天蓋地的報道。但你看雅虎、國外的網站,會有一點報道,但報道一下就可以了,不是搞得好像大家都靠這個活著。為什么?因為這是AlphaGo2。做原創,第一次做這件事是最重要的。就像捅破窗戶紙一樣,第一下很重要,第二下就不那么重要了,你已經知道房間里面發生什么事情了。
再看一個地圖,Deep learning的搜索次數,顏色深代表搜索的次數多,淺的代表搜索次數少。大家可以看到中國的顏色最深,而且深很多,對這個詞的搜索量最大。但是這是谷歌的搜索結果,谷歌在中國老百姓是搜不了的,你要翻墻,這大概只有做技術的人才知道怎么做。翻墻的搜索量都比全球的任何國家的搜索量高很多,可以想像這在中國有多熱。為什么這么熱?因為我們不懂,我們這么多年沒有做原創技術。中國有句成語“不明覺厲”,因為你不知道怎么回事才覺得厲害。還有一句話叫“文人相輕”,你是文人,你知道他的水平和高度,互相之間會不服氣,如果你都不是文人,哪里有資格去輕視別人呢。
前段時間Amazon、IBM、谷歌、微軟,Facebook組成了人工智能聯盟,當時我們覺得國外人工智能的發展已經非常非常超前了。我們如何競爭?Eric剛才講了人工智能應該是全球的合作,是共贏。合作是雙方都要做事情的,是雙方平等的合作,不是說別人做了,你把它拿過來就用,然后賺錢,這不是合作,這是盜版。
人工智能,我們是否落后得很遠?我從商湯公司做的事情來講一下,我們現在處于什么水平。人工智能的發展歷史我就不講了,幾起幾落,前面的學者已經總結過了。真正的落地是2011年,深度學習算法在語音識別方面取得重大突破,是當時Hinton和微軟的鄧力合作取得的成績。后來才有了2013年谷歌、Facebook的大量投入,和到現在的直線上升。
2011年我們開始做深度學習,當時應該是最大的華人團隊。2011到2013年全球最頂級的計算機視覺學術會議CVPR/ICCV上,29篇文章涉及到深度學習,14篇由我們一個實驗室做的,做了全球的一半。
最近兩年,谷歌、Facebook開源了AI平臺,相當于AI的操作系統。我們最早的時候沒有Torch和TensorFlow,我們經過多年的積累,做出我們自己的深度學習Parrots系統,我們把幾百塊的GPU連起來。訓練了1207層的深度學習網絡,林達華教授帶領學生做了這項工作,他也是從Eric實驗室幾年前畢業的博士生。
我們和Facebook競爭的例子,就是人臉識別。2014年Facebook發表了文章,人臉識別算法接近人眼的能力,我們同一時間發表了另外一篇文章,搶在Facebook之前,第一個用計算機做人臉識別超過人的眼睛。這其實是和AlphaGo相似的事情,在人類定義的一項任務上,機器超過了人類。我們當時用了20萬的人臉數據做的。平時做研究,一兩萬的人臉數據就很了不起了。用了20萬的人臉數據,我們覺得我們會碾壓所有的人。還沒有開始碾壓,發現Facebook用了750萬的數據,數據量上把我們碾壓了。但是計算的結果,我們超過了他們,連做了3、4個算法,最后做到了99.5%,戰勝Facebook。在中國,馬上出現大批的公司重現一下算法,開始人臉識別落地應用的時代。
Imagenet,2012年有很大的突破。2014年是最大的一次比賽,38個團隊,包括Google、伯克利、牛津,微軟等頂級實驗室都參加了,我們取得了全球第二名,輸給了Google。當然,Google也是競賽的組織者,我們贏他也比較難。
2015到2016年,ICCV、CVPR、ECCV三個頂級國際會議上發表的文章數量。微軟124篇,CMU86篇,商湯和我們實驗室一起76篇,全球前三名,我們是整個亞洲唯一前10名的團隊。
最后看一下百度、阿里、騰訊,三家的估值加起來在9000億美金上下。三家公司加起來的文章數是13篇。你想用AI作為你的未來,是要投入的,要做原創的,而不是拿來的。我們取得的這些成績,也得到了國際上的承認。
我們非常榮幸,和MIT、斯坦福,伯克利、谷歌等實驗室,被評為全球十大人工智能先驅實驗室,我們是整個亞洲唯一的代表。我講的這些是學術上的研究和成績。如果只有這些,其實我們沒有數據,沒有應用,我們的人也很少。一開始,會搶跑一下,領先一下,長時間的競爭我們無法持續抗衡Google這樣超高投入的公司。所以我們也要落地,很幸運,通過積累,我們現在有120位深度學習的博士,核心人員體量和Facebook、Google差不多,我們是中國唯一一個深度學習平臺公司。非常榮幸,這次《華爾街日報》報道我們單輪融資打破全球最大一筆AI創業公司融資記錄,4.1億美金。以前是我們以幾千萬美金,打一場看起來完全不對等的戰爭,現在我們補充進了彈藥。非常高興,到今天有400多家頂級的客戶,包括中國移動,包括銀聯,包括華為等巨型公司。400家公司意味著過去一年半的時間,每天簽約一家公司。我們用我們的深度學習平臺為核心大腦,在做人臉識別,在做芯片、醫療、自動駕駛、金融,手機等14個行業的人工智能應用研發,和14個行業的合作伙伴合作,我們會反饋回來大量的應用需求和數據,形成完整的閉環、正循環。去年的雙創活動中,很榮幸和百度被選為代表中國人工智能的兩家企業,參加北京地區的展覽。
最后還是用一個電影來結束。我這個年齡的人,對《上甘嶺》這部電影都很熟悉,當時打的最后一場戰斗,也就是一個連。
我們120個博士,也差不多就是這樣的人數。如果我們這只隊伍失敗了,打散了,守不住《上甘嶺》,中國人工智能的三八線也就基本結束了,謝謝大家!
- 免責聲明
- 本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。 交易和投資涉及高風險,讀者在采取與本文內容相關的任何行動之前,請務必進行充分的盡職調查。最終的決策應該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產生的任何金錢損失負任何責任。