更“聰明”、更強大的GPT-4來了!有哪些新升級?為何要收費?
ChatGPT升級版來了!3月14日,火遍全球的ChatGPT母公司OpenAI正式發布升級后的GPT-4。
相比之前的版本,升級版人工智能(AI)聊天機器人GPT-4更“聰明”了。它不僅能夠聊天、寫詩、寫代碼,還能分析圖像,處理更大的文本塊。在模擬的律師資格考試中,GPT-4甚至打敗了90%的人類考生。對于AI聊天機器人此前暴露出的“幻覺”、偏見等缺陷,GPT-4也有所改進。但專家指出,這并不意味著這些缺陷已被修復,GPT-4仍會做錯最基礎的算術題。另據介紹,和ChatGPT不同,使用GPT-4需每月支付20美元的訂閱費。
有哪些新升級?
四個月前,初創公司OpenAI發布基于大型語言模型GPT-3.5改造的ChatGPT,引爆AI聊天機器人熱潮。該公司得到美國科技巨頭微軟的支持。
四個月后,萬眾矚目下的GPT-4,又將帶來哪些驚喜?
首先,GPT-4更“聰明”也更強大。
在3月14日發布的一篇文章中,OpenAI將GPT-4稱為擴展深度學習方面的“最新里程碑”,遠超其“前任”。文章稱,GPT-4更可靠、更具創造性,也能夠處理更細致的指令。
為了直觀地體現新版本的“聰明”程度,OpenAI讓GPT-4參加了多項人類通用考試。結果表明,GPT-4已具備“人類水平的表現”,在各類考試中成績拔尖。
比如,在美國律師資格考試中,GPT-4的成績在考生中排名位列前10%,而GPT-3.5的得分在倒數10%。在SAT閱讀考試中,GPT-4也已超過93%的人類考生,比GPT-3.5進步了6%。
其次,GPT-4還有了一項新突破——可以開始處理圖像。
OpenAI稱,GPT-4是一個多模態大模型,可以接受文本和圖像形式的輸入,并用文本進行輸出。不過,目前圖像輸入的權限尚未公開。
在《紐約時報》提供的例子中,用戶上傳了一張冰箱內部的照片,然后問道:“我可以用這些做幾頓飯?”GPT-4則細致地提供了建議,教用戶如何使用冰箱里的材料,制作酸奶碗和鷹嘴豆泥卷餅。
此外,GPT-4還變得更專業。
據OpenAI介紹,在一些日常聊天對話中,兩者間的差距可能較為微妙,但當任務的復雜性達到一定閾值,差異就會顯現。
北卡羅來納大學心臟病學教授阿尼爾·格希(Anil Gehi)就深有體會。在他向GPT-4描述一位病人的病史、入院后的并發癥后,聊天機器人給了他一個完美的答案,格希說:“我們就是這樣對待病人的。”
在其他嘗試中,GPT-4同樣給出了令人印象深刻的答復,比如能夠處理超過2.5萬字的文本,輕松總結出文章大意;幫助一對夫妻報稅;還會根據要求寫代碼,10秒就能生成一個網站……
《紐約時報》還發現,GPT-4已發展出一定的幽默感和推理能力:“雖然它還在寫那些令人尷尬的‘老爹笑話’,但它比前任稍微有趣了那么一點。”
仍會做錯算術題
雖然GPT-4看似甩開前任一大截,但不得不指出的是,GPT-4仍與此前的語言模型一樣,具有相似的局限性。這讓一些業內人士和專家感到擔憂。
GPT-4仍可能展現出令人困惑的兩面性。《紐約時報》表示,它可以是某些學科的專家,但對另一些學科則是外行。它可以在標準化測試中比大多數人做得更好,為醫生提供精確的醫療建議,但同時,它連基礎的算術題都可能做錯。
更為重要的是,GPT-4仍可能產生“幻覺”,它仍會“一本正經地胡說八道”,大膽自信地編造事實,也會出現很多推理錯誤。
《華盛頓郵報》也指出,由于接受了大量互聯網文本和圖像的訓練,AI語言模型也學會了人類對種族、性別、宗教和階級的偏見,這可能會導致對現實世界的傷害。
對此,OpenAI承認,GPT-4并不完全可靠。不過該公司強調,GPT-4已接受為期半年的安全訓練,在內容生成方面更加安全和一致。在內部評估中,相比GPT-3.5,GPT-4不合規內容的響應請求已減少82%,響應事實準確度則增加了40%。
但加州大學伯克利分校專門研究國際商業和信息安全的教授史蒂文·韋伯(Steven Weber)認為,現在下結論還為時過早,因為GPT-4尚未在現實世界中得到廣泛測試,“正如我們之前看到的那樣,面向外界后GPT-4將如何運轉,可能(和想象中)很不一樣。”
美國卡內基梅隆大學研究人工智能方面的教授文森特·康尼策(Vincent Conitzer)也表示,雖然GPT-4似乎增加了新的護欄,防止產生不合適的回答,但用戶仍可能會用其他方式達到目的。
不過,拋開局限性不談,短短幾個月內OpenAI展現出的巨大進步仍讓計算機科學家驚嘆。
《紐約時報》稱,目前科技行業正陷入“幾十年來最不可預測的時刻之一”。許多行業領導者認為,AI的發展代表著一種根本性的技術轉變,其重要性與20世紀90年代初網絡瀏覽器的發明不相上下。
更多應用場景
更強大的功能、更專業的表現,意味著GPT-4接受了大量數據訓練,也意味著更高的成本。
對此,OpenAI也使出了新招——收費。據介紹,和ChatGPT不同,使用GPT-4需每月支付20美元的訂閱費。但就算收費,“嘗鮮者”仍絡繹不絕,OpenAI付款系統曾一度被擠爆。
如果不想付費,搭載了AI聊天機器人的微軟必應搜索引擎可能會是一項替代。據透露,過去幾周以來,該搜索引擎使用的就是GPT-4。
OpenAI還開始銷售GPT-4的訪問權限,以便企業和其他軟件開發人員在其基礎上構建自己的應用程序。這也意味著,相關AI技術未來將應用到更多場景中。
摩根士丹利財富管理公司就正利用GPT-4建立內部系統,為員工檢索并合成信息,以對話形式提供給金融顧問。教育公司Khan Academy則正使用該技術建立自動化在線家教。語言學習應用Duolingo也在使用該技術建立對話式語言機器人。
另據彭博社報道,幫助盲人及弱視人群的志愿服務軟件Be My Eyes也在利用這項AI技術,解答盲人日常中的疑問并提供視覺幫助。
越來越多的應用場景也帶來隱憂:我們的工作會被AI取代嗎?
有分析認為,即使是最出色的AI技術和系統,也往往是熟練工的補充,而不會取代他們。這些系統不能取代醫生、律師或會計師,仍然需要專家來糾錯。不過,它們可能很快會取代一些助理或審核人員的工作。
OpenAI總裁格雷格·布羅克曼在談及此事時也表示,AI的出現一定會帶來一些混亂,也意味著一些工作崗位的消失,但一些新的工作崗位會出現:“我認為,最終的結果是,進入門檻將降低,專家的生產率將提高”。
- 免責聲明
- 本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。 交易和投資涉及高風險,讀者在采取與本文內容相關的任何行動之前,請務必進行充分的盡職調查。最終的決策應該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產生的任何金錢損失負任何責任。