GPT是吹起來的泡沫嗎?
觸摸虛擬世界 (視覺中國/圖)
2023年,最具熱度的科技新聞非GPT莫屬。自從2022年11月OpenAI推出基于GPT-3.5架構的chatGPT以來,ChatGPT就以其與真人極其相似的對話和寫作能力,以及在許多知識領域給出詳細和清晰的回答而迅速獲得
一時之間,這一本來最新科技的進展,變成了一項全民話題。人工智能從業者見之技術創新,人文學者見之社會影響,風投資本見之風口,自媒體們見之流量。
現在,當這股熱潮稍稍降溫之后,也許正是時候,讓我們可以稍微冷靜地來看待,引發這股全球熱潮的GPT到底是什么。它在現在以及將來,又會對我們的生活產生怎樣的變革。
在正式開始這次的探尋之旅之前,我們不得不先提出這么一個略顯尷尬的問題。這是因為,近幾年的科技新聞中,有著太多“狼來了”的故事。區塊鏈、元宇宙、腦機接口、火星之旅……幾乎每隔一段時間,這些科技公司就會拋出一個這樣或者那樣的,看似驚人的新突破,在全球范圍內引發一次或大或小的討論。但是結果呢,這些所謂的“突破”,或者像區塊鏈一樣,至今仍然沒有任何真正大范圍的實際應用;或者像腦機接口、火星之旅一樣,到現在還只停留在PPT的階段;又或者像元宇宙一樣,只是一些已經有的概念和元素的整合,本身并沒有什么真正的技術創新和突破,所以在一陣熱潮過后就會快速地偃旗息鼓。
造成這種情況的原因,一方面是因為,能夠最終轉化成為真正大眾化產品的科技新品,始終是極少數。過去十幾年我們所習以為常的,像智能手機和移動互聯網這樣,能夠真正改變我們生活方式的科技產品,反而是極為罕見的情況。
另外一方面,科技公司的模式就決定了,它需要不停制造新的話題,來吸引投資者和消費者的注意力。而且,現在的互聯網本身就是和科技公司深度綁定的,這也就使得這些話題更容易在互聯網上有著更高的討論度。
這次GPT的熱潮,同樣有互聯網放大的因素在里邊。那么,GPT是不是另外一個科技公司吹起來的泡沫呢?想要回答這個問題,我們先要搞清楚,所謂的GPT,到底是什么。
GPT是什么?
其實,GPT的名字,就已經說明了它是什么。所謂GPT,是Generative Pre-trained Transformer的首字母縮寫,即:基于轉換器的生成式預訓練模型。Transformer模型,是2017年由谷歌大腦的一個團隊推出的一個主要用于自然語言處理(NLP)與計算機視覺(CV)領域的深度學習模型。包括GPT,以及Google的BERT等模型,都是基于Transformer模型開發而成的,這也就是它們名字中最后一個字母T的來源。
從理論上說,包括GPT在內的所有人工智能類的產品,都是一個數學模型;或者更為直接的說法,它們都是一個“函數”。
舉個最簡單的例子,如果要設計一個用來挑選西瓜好壞的模型,那么我們首先要確定哪些西瓜的變量決定了西瓜的好壞。根據常識,我們知道,根據一個西瓜瓜皮的顏色,瓜蒂是否新鮮,敲起來聲音是否清脆,就可以大概率判斷一個西瓜是不是好瓜。因此,可以把這幾個因素定量數據化。只要找到了一個合適的“函數”,輸入這些數據,就能知道面前的西瓜是不是好瓜。
現在人工智能領域的絕大多數工作,都遵循這樣一個“簡單”的做法。只不過在具體操作上,和挑西瓜這件事比起來,難度就像是用紙折一張小船,和建造一艘航空母艦的差別一樣。
在挑西瓜的例子里,我們只需要三個參數就足夠了,而要找到這樣的一個“函數”,也只需要至多幾十次的嘗試就夠了。這是因為挑西瓜這件事,是一個很明確的單一任務,它所面對的情況也非常的簡單。
但是,對于GPT來說,情況就完全不是這樣的。OpenAI在2018年6月推出的第一代GPT-1,參數數量為1.17億,2019年2月推出的GPT-2,參數數量就來到了15億。而到了2022年6月GPT-3,其參數數量達到了1750億。隨后的GPT-3.5和GPT-4,OpenAI沒有再繼續公布具體信息。但是據猜測,GPT-4的參數數量可能高達1.76萬億。巨量的參數,正是包括GPT系列在內的,這一批自2018年開始逐漸成為主流的語言模型的主要特點。因此,它們也被稱為大型語言模型(LLM,Large language model)。
與如此巨大的參數數量相匹配的,是GPT系列巨大的訓練集。據稱,為了訓練GPT,OpenAI使用了整個互聯網上的信息。以至于在微軟研究院2023年3月22日發布的GPT-4的性能測試報告當中多次寫道:為了測試GPT-4的能力,特地由相關專家擬定了一些在互聯網上沒有的新題目。
如此巨大的參數數量,和龐大的訓練集,使得訓練GPT需要花費巨量的硬件和能源。僅OpenAI在2023年1月一個月的用電量,就相當于17余萬個家庭一年的用電量。
如此巨大的付出,也帶來了高額的回報。ChatGPT能夠“聽懂”人類的語言,并且對于提出的各種問題,給出流暢、通順,且符合邏輯的回答。而根據微軟研究院的報告,相較于ChatGPT,GPT-4在數學、編程、醫學、法律、心理學等專業知識領域有了大幅提升。更加讓人印象深刻的是,在以往被認為只有人類才有的,我們稱之為“智力”的方面,例如推理、計劃、解決問題、抽象思維、理解復雜思想、快速學習和從經驗中學習等方面,GPT-4也做出了優秀的表現。
ChatGPT和GPT-4的優異表現,引起了人工智能領域廣泛的
這種情況并非是GPT獨有的。其他的大型語言模型,在參數數量超過一個界限之后,也都或多或少地出現了能力飛躍式提升的情況。以至于在相關領域,專門為這種現象起了一個名字,叫做大型語言模型的“涌現”現象。
涌現是一個來自于復雜系統理論的概念。它指的是,當許多小實體相互作用合成為一個大實體之后,這個大實體展現了組成它的小實體所不具有的特性。在物理學、生物學和經濟學等領域,都有用涌現來描述的現象。甚至有些學者還用涌現來解釋人類意識的出現。用涌現來解釋大型語言模型能力涌現這一現象,似乎是非常合理的。但是,涌現本身只是一個描述性的概念。用它來解釋各種現象背后的原因,就好像是用玄學來解釋玄學一樣。
而想要真正弄清楚大型語言模型能力涌現的原因,卻并不是一件容易的事情。正如前文所說,包括GPT在內的大型語言模型的參數數量,已經來到了一個非常夸張的程度。更大的問題在于,這些參數并不是人為設置的,而且大型語言模型是在不斷地訓練當中,自行調整完善的。這就使得現在的大型語言模型看上去,就是一個黑箱,我們對它內部具體是怎樣運作的,其實并不知道。
因此,對于這一驚人的現象,相關領域的專家們,目前也只能提出一些猜測。例如有人提出,造成大型語言模型能力涌現的原因,是因為任務的評價指標不夠平滑。對于很多任務,只有當完全回答正確的時候,才會通過模型給出正確的答案。因此,很可能隨著模型參數的增加,給出的回答是在不斷接近正確答案的,只是因為模型的表達方式,導致了最終我們看到的結果是,當模型的參數超過一個界限之后,突然能夠回答正確很多問題。
另外一個主流的猜測則認為,模型在解決很多復雜任務的時候,會把任務拆分成很多小任務來完成,只有當這些小任務都順利完成,我們才會看到模型順利完成了任務。而這些小任務,則依賴于模型體量的大小。因此,當模型的參數超過一個界限之后,它能夠順利完成所有的小任務,從而能夠突破性地完成很多之前完成不了的復雜任務。
這些猜測到底哪一個是正確的,還有待相關專家的進一步研究。但是,現在GPT-4所表現出的能力,就使得我們不得不去思考,現階段的GPT-4,到底是一臺機器,還是一個已經開始覺醒智慧的人工智能?照這樣發展下去,人類是否真的會被AI所超越?
GPT有智能么?
與AlphaGo這一類專門用來解決特定任務的人工智能產品不同。包括GPT在內的大型語言模型,從一開始就是為了解決各種任務所研發的通用人工智能。
在人工智能領域,通用人工智能還有另外一個名字,叫做“強人工智能”。它的終極目標,就是具備與人類同等智能、能表現正常人類所具有的所有智能行為,或者超越人類的人工智能。
那么現階段的GPT-4,在多大程度上具備了人類的智能?沿著這個方向繼續發展下去,是否真的能夠創造出和人類具備同等智能,甚至超越人類的人工智能呢?
根據微軟研究院的報告,GPT-4在很多領域,已經接近了人類的水平。在諸如編程等專業領域,GPT-4的表現甚至超過了人類中相關從業者的平均水平。另外一則報道則顯示,GPT-4為了通過人機測試,甚至會說謊欺騙人類。
這一切似乎都在表明,GPT-4具備“相當的”智能水平。
實際上,對于強人工智能應該滿足什么標準,相關領域的科學家們提出了很多的測試項目,用以測試人工智能在不同方面的能力水平。
這其中最為著名的,應該就是由“人工智能之父”阿蘭·圖靈提出的圖靈測試。圖靈測試是說,如果一個人(代號C)使用測試對象皆理解的語言去詢問兩個他不能看見的對象任意一串問題。對象為:一個是正常思維的人(代號B)、一個是人工智能(代號A)。如果經過若干詢問以后,C不能得出實質的區別來分辨A與B的不同,則此人工智能A通過圖靈測試。
在很多科幻作品當中,圖靈測試被描述為一項玄而又玄的測試。似乎只要通過了這項測試,人工智能就會變得與人類別無二致,甚至會由此開始取代人類。但是實際上,對于圖靈測試能否真正地測試出人工智能的能力水平,一直以來都有著很多的爭論。而且,相較于更多側重于文字或者語言表達方面的圖靈測試,其他的人工智能測試,選擇了從不同的角度來測試人工智能的各項能力。
例如沃茲尼亞克提出的咖啡測試,要求人工智能在陌生的環境中,完成一些諸如沖泡一杯咖啡這樣的日常工作,用以測試人工智能認知陌生空間,并完成具體操作的能力。再如格策爾提出的學生測試,要求人工智能去注冊一所大學,參加和人類學生同樣的考試,然后通過并獲得學位。用以測試人工智能學習、分析和回答問題的能力。還有尼爾森提出的,用以測試人工智能統籌、推斷、規劃解決復雜問題的能力的雇員測試等。
根據微軟研究院的報告,以及其他一些研究顯示,GPT-4在不少測試當中都取得了很不錯的成績。例如預印本網站上的一篇文章就宣稱,GPT-4在MIT的數學和EECS(電氣工程和計算機科學系)本科學位考試中,表現出的能力完全滿足畢業要求。
但是需要指出的是,所有的這些測試,都只是一些必要性測試,即使通過了所有這些測試,也并不意味著人工智能就達到了人類的智能水平。
而且,對于現在這些大型語言模型在將來能否發展出真的強人工智能,也是一直有爭議的。例如圖靈獎得主楊立昆(Yann LeCun),就一直對GPT的發展持否定態度。他認為這類大型語言模型存在局限性,有很多問題無法解決,因為它們并不了解這個世界底層的事實(underlying reality)。
GPT會讓“我”失業么?
將來是否會出現真正的強人工智能?這個問題或許離我們現在還過于遙遠。但是ChatGPT和GPT-4的推出,的確給我們提出了一個現實的問題。那就是,現階段的GPT,以及在可以預見的時間內出現的更為強大的大型語言模型,將會怎樣改變我們的生活?或者說的更直接一些,“我”是否會因為這些東西而失業?
首先,對于現在的大多數寫字樓內的文案工作,以及基礎的代碼編寫之類的工作等,以現在GPT的能力,是足以勝任的。這很大程度上并不是因為GPT真的有多么的強大,而是因為,絕大多數的日常工作,并沒有那么高的要求,而且有著相對較高的容錯度。甚至可以說,很多這樣的日常工作,更多地是花費時間的體力勞動。
從歷史上看,對于這些工作來說,人工被機器取代這件事,并不會因為工作者的意志而有所改變。機器的效率是必然遠高于人工的。因此,這其中起決定性因素的就是,機器的成本,是否會高于人工的價格,以及將人工替換成機器的花費。從第一次工業革命中的紡織機取代紡織工人,到上世紀的自動流水線取代裝配工人,這樣的事情已經發生過很多次了。
對于那些像是科研、藝術和文學創作之類,被認為是凝結著人類智慧精華的工作來說,情況則要復雜得多。
對于包括數學、理論物理等學科在內的理論性學科來說,GPT還難以進入真正的研究領域當中。雖然菲爾茲獎得主、華裔數學家陶哲軒最近宣稱,他已經開始使用GPT-4來協助自己的工作,但是他也只是使用GPT-4進行一些諸如整理文檔、生成和潤色文本、檢索信息之類GPT本身就很擅長的工作,而并沒有讓GPT-4去代替他思考怎么解決數學問題。
根據微軟研究院的報告,數學能力,在GPT-4的各項能力當中,本身就是一個相對的弱項。這很大程度上因為,GPT的訓練和養成,主要是靠互聯網上的信息。而對于數學這樣依靠嚴格的邏輯推理,環環相扣的學科來說,想要通過互聯網上零散、碎片化的信息,來獲得完整的數學知識,以及嚴謹的數學推理方式,是十分困難的。而數學這樣的學科,偏偏就是對嚴謹性有著極高要求的學科。
更大的問題在于,能夠用文字寫出來的數學內容,和進行數學研究所需要的能力,并不是完全對應的。相信很多人在學生時代都有過這樣的體驗,數學課上所學的內容,和數學考試中所考的題目之間,似乎有著一些距離。死摳書本的學習,很多時候并不能在數學考試中獲得高分。
這種情況在數學研究中更為常見。數學家們寫出來的論文,只是他們思考的結果。至于他們是怎么想到那些的,則很大程度上來源于多年從事數學研究工作的積累和養成的經驗。這些東西,是很難用一套規范的語言寫下來的。這也就是為什么直到現在,數學方面的學術會議上,仍然會有很多數學家堅持使用黑板+粉筆的方式來作報告。因為通過板書的書寫,可以傳達出他的思考過程。
因此,在這些科研領域,GPT之類的大型語言模型,可以成為很好用的輔助工具。但是想要讓它們真正取代科研工作者的作用,去獨立進行有價值的科研工作,目前看來還為時尚早。
GPT與藝術創作
對于同樣體現著人類智慧與創造力的藝術和文學等領域,情況則要復雜得多。
一方面,在諸如小說、詩歌的創作,文學作品的翻譯之類的領域,GPT仍然無法替代小說家、詩人、翻譯家的作用。但是另外一方面,以現在GPT的水平,在可以預見的未來,幾乎必然會引起這些行業發生巨大的變化。
這看上去似乎有些矛盾。實際上,導致這種矛盾結論的,正是藝術領域的特殊性。雖然同為人類創造性的工作,但是和科研領域有著明確的目的和邊界不同,藝術領域是模糊和不確定的。這就給了GPT這樣的新興技術進入的空間。
在歷史上,這種因為技術發展,導致藝術的范圍和形態發生根本性改變的例子并不在少數。例如,在照相術發明普及之前,歐洲畫家們的收入來源的很大一部分,是定制肖像畫,以及為教堂等地方繪制壁畫。我們熟悉的那些古典繪畫大師,都從事過這樣的工作。在這一時期,對繪畫作品的需求,是很多歐洲普通市民的日常剛需。這也就使得在當時的歐洲,有著很多以此為業的畫家和作坊。這個龐大的底層從業者的基數,和完善的學習途徑,就為歐洲數百年間持續產生繪畫大師提供了土壤。
但是在攝影術發明普及之后,情況就發生了徹底的改變。作為收入的重要來源之一,肖像畫的需求量大量減少,這就使得繪畫這一行業能夠養活的從業者大量減少。與此同時,攝影術逼真的效果,也迫使歐洲繪畫藝術從古典主義繪畫“畫得像”的要求開始轉變,進而誕生了那些我們現在耳熟能詳的現代藝術流派。
從結果上看,攝影術的發明,并沒有阻礙那些真正有天賦的藝術家們走上這條路。達·芬奇、倫勃朗等大師,放在今天的環境下,大概率也能成為偉大的畫家。但是,攝影術的發明,徹底改變了繪畫的生態,把這一本來與普通大眾極為接近的行業,變成了一門小眾的高端行業。更不用提在這個轉變的過程中,大量的沒有那么高的藝術天賦,但是本來可以依靠畫肖像畫來維持生活的畫家,將會面臨怎樣的窘境。
同樣的情況,極有可能隨著將來GPT之類工具的普及再次上演。
以翻譯工作為例,GPT也許在很長時間里,都很難達到翻譯名家們那種信達雅的功力。但是翻譯工作并不僅僅是文學翻譯而已。除此之外還有大量的技術性文件的翻譯,工作上的文書翻譯等工作。這些工作加在一起,才支撐起了現在文字翻譯群體的輸入來源。甚至有很多從事文學翻譯的工作者,也會接這種翻譯工作來作為收入的一部分。
而GPT的普及,必然會擠占掉這部分的工作機會,導致整個翻譯群體的萎縮,以及從頭開始的訓練機會的減少。這就很有可能改變翻譯這一行業的整個生存狀態。
同樣的情況,在小說、繪畫、音樂等藝術領域,都有可能出現。
對于我們每個人來說,潘多拉魔盒已經打開了,將來會發生什么,也許在不遠的未來就能知曉。
左力
- 免責聲明
- 本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。 交易和投資涉及高風險,讀者在采取與本文內容相關的任何行動之前,請務必進行充分的盡職調查。最終的決策應該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產生的任何金錢損失負任何責任。