生成式人工智能會(huì)塑造信息繭房?復(fù)旦教授揭示如何讓危機(jī)“已知”
【編者按】
2023年5月27日,是復(fù)旦大學(xué)118周年校慶。“校慶種種活動(dòng),以促進(jìn)科學(xué)研究為中心。”從1954年校慶前夕時(shí)任校長(zhǎng)陳望道提出這一主張開(kāi)始,在校慶期間舉辦科學(xué)報(bào)告會(huì),成為復(fù)旦的重要學(xué)術(shù)傳統(tǒng)之一。
賡續(xù)學(xué)術(shù)傳統(tǒng),百年弦歌不絕。5月9日起,來(lái)自文社理工醫(yī)各學(xué)科的50多位復(fù)旦名師將陸續(xù)帶來(lái)學(xué)術(shù)演講。
“2023相輝校慶系列學(xué)術(shù)報(bào)告”第十場(chǎng),由復(fù)旦大學(xué)國(guó)家智能評(píng)價(jià)與治理實(shí)驗(yàn)基地副主任、大數(shù)據(jù)研究院教授趙星,與浙江大學(xué)公共管理學(xué)院信息資源管理系“百人計(jì)劃”研究員蔣卓人于線(xiàn)上線(xiàn)下共話(huà)“生成式人工智能的挑戰(zhàn)與治理”。

活動(dòng)現(xiàn)場(chǎng)。 本文均為 復(fù)旦大學(xué) 供圖
從2011年蘋(píng)果手機(jī)首次推出的Siri語(yǔ)音助手,到今年包攬奧斯卡七大獎(jiǎng)項(xiàng)的電影《瞬息全宇宙》,生成式人工智能早已融入人類(lèi)生活。當(dāng)下,ChatGPT類(lèi)工具進(jìn)一步引爆全球人工智能熱潮,趙星和蔣卓人攜手帶來(lái)一場(chǎng)貫穿生成式人工智能前世、今生和未來(lái)的學(xué)術(shù)盛宴,解析生成式人工智能帶來(lái)的多重挑戰(zhàn),啟發(fā)我們對(duì)其治理問(wèn)題的思考。
生成式人工智能的前世今生
金色的夕陽(yáng)被烏云遮住,小草在風(fēng)雨中搖曳,水珠在葉片上滾動(dòng)……蔣卓人首先播放了一段名為“Summer showers”(《夏日陣雨》)的視頻。這段充滿(mǎn)靈動(dòng)色彩和生動(dòng)風(fēng)景的視頻,卻完全是由生成式人工智能模型創(chuàng)作的。
何為生成式人工智能?
目前,生成式人工智能還沒(méi)有統(tǒng)一的定義,一般可以理解為一種能夠根據(jù)提示生成文本、圖像或其他媒體信息的人工智能系統(tǒng)。
“這個(gè)技術(shù)不是像魔法一樣憑空出現(xiàn)的,而是有著悠久的歷史淵源。”蔣卓人強(qiáng)調(diào)。在生成式人工智能90多年的發(fā)展歷程中,不乏人類(lèi)智慧閃耀的時(shí)刻。
1932年,法國(guó)工程師Georges Artsrouni創(chuàng)造了裝置“mechanical brain”(機(jī)器大腦)。它通過(guò)查詢(xún)多功能詞典完成翻譯,輸入、輸出都是一條紙帶。蔣卓人認(rèn)為,雖然它和今天的機(jī)器翻譯不同,但它完全符合今天對(duì)生成式人工智能的定義,即人類(lèi)輸入一段內(nèi)容,機(jī)器產(chǎn)生一段新的內(nèi)容。
在20世紀(jì)中,麻省理工學(xué)院創(chuàng)造了最早的生成式人工智能之一Eliza,Judea Peal(朱迪亞·珀?duì)枺┮肓素惾~斯網(wǎng)絡(luò)因果分析概念,Yann Lecun(楊立昆)等展示了如何利用卷積神經(jīng)網(wǎng)絡(luò)來(lái)識(shí)別圖像……
2006年,華裔計(jì)算機(jī)科學(xué)家李飛飛著手構(gòu)建數(shù)據(jù)庫(kù)ImageNet。該數(shù)據(jù)庫(kù)中有超過(guò)1400萬(wàn)張手工標(biāo)注的圖片,包含超過(guò)2萬(wàn)個(gè)類(lèi)別。“正是有了這樣一個(gè)龐大數(shù)據(jù)庫(kù)的支撐,深度學(xué)習(xí)才能得以興起。所以我們總說(shuō),好的科研品位,加上持續(xù)不斷的努力,就能成就一段好的學(xué)術(shù)生涯。”蔣卓人評(píng)價(jià)。
ChatGPT何以成為明星產(chǎn)品?
1750億參數(shù)量,3000億訓(xùn)練單詞數(shù),這是ChatGPT的數(shù)據(jù)。2022年發(fā)布后,ChatGPT在短短兩個(gè)月內(nèi)吸引了超過(guò)1億的用戶(hù),成為有史以來(lái)用戶(hù)增長(zhǎng)最快的應(yīng)用。
蔣卓人認(rèn)為,要理解ChatGPT,就要理解它的關(guān)鍵技術(shù):大模型基礎(chǔ)訓(xùn)練、指令微調(diào)、人類(lèi)反饋強(qiáng)化學(xué)習(xí)。
“大模型的全稱(chēng)是大型語(yǔ)言模型,”蔣卓人講道,“它是一種概率模型,能告訴你一個(gè)詞出現(xiàn)的概率是多少。”

蔣卓人教授
比如,在The students opened their這句英文后面,可以出現(xiàn)books、laptops、exams、minds等詞。“但它們出現(xiàn)的概率是不一樣的。一個(gè)好的語(yǔ)言模型,能精準(zhǔn)地預(yù)測(cè)下一個(gè)詞是什么。”蔣卓人說(shuō)。
隨著語(yǔ)言模型的發(fā)展,它具備了良好的語(yǔ)言理解能力,但如何讓其與人類(lèi)建立對(duì)話(huà)呢?
研究者們提出的辦法是指令微調(diào)。通過(guò)引入思維鏈以及代碼生成,大模型的推理能力得以提升。“這種能力對(duì)于大模型來(lái)說(shuō)至關(guān)重要,使其可以在開(kāi)放領(lǐng)域有很好的表現(xiàn)。”蔣卓人評(píng)價(jià)。
至此,大模型初步具備了回答人們提出的任何指令的可能,但回答的質(zhì)量卻參差不齊,如何讓大模型持續(xù)性地輸出高質(zhì)量回答呢?
研究者們又為此設(shè)計(jì)了一套基于人類(lèi)反饋的強(qiáng)化學(xué)習(xí)方法,即通過(guò)大模型的微調(diào)、獎(jiǎng)勵(lì)函數(shù)的訓(xùn)練、以及大規(guī)模強(qiáng)化學(xué)習(xí)的優(yōu)化來(lái)確保高質(zhì)量回答的生成。“OpenAI就是使用這種方法,大幅度降低了數(shù)據(jù)集構(gòu)建成本。”蔣卓人說(shuō)。
生成式人工智能:新智能面臨新挑戰(zhàn)
面對(duì)生成式人工智能帶來(lái)的挑戰(zhàn),趙星從資源、技術(shù)、應(yīng)用與社會(huì)倫理四個(gè)維度進(jìn)行解讀。
從資源維度來(lái)看,生成式人工智能需要高質(zhì)量的數(shù)據(jù),而中文世界的數(shù)據(jù)質(zhì)量弱于英文。趙星認(rèn)為,即使有很強(qiáng)大的翻譯能力,類(lèi)ChatGPT工具的中文處理效果也顯著弱于英文,核心的原因之一是投喂的中文數(shù)據(jù)質(zhì)量較差。另外,硬件技術(shù)也是支撐我國(guó)人工智能產(chǎn)業(yè)高速發(fā)展的關(guān)鍵要素。

趙星教授
“科技界曾將人工智能的應(yīng)用比作煉金術(shù),”趙星打趣道,“人們將數(shù)據(jù)一股腦往模型里面扔,至于能否煉出有價(jià)值的東西,煉出的是什么,卻沒(méi)有明確的預(yù)期。”很明顯,在技術(shù)層面上生成式人工智能存在內(nèi)生的不確定性。
“當(dāng)我們準(zhǔn)備向全社會(huì)投放一種通用性工具,卻不能明確它的科學(xué)原理是什么,就一定會(huì)有內(nèi)生性的風(fēng)險(xiǎn)。”人工智能風(fēng)險(xiǎn)中最核心的一點(diǎn)在于其結(jié)果的不可承受性。“我們很少在治理問(wèn)題上處于如此無(wú)力的狀態(tài),”趙星說(shuō)。在應(yīng)用層面上,生成式人工智能產(chǎn)業(yè)發(fā)展的確定性與風(fēng)險(xiǎn)治理的不確定性將長(zhǎng)期存在。
而在社會(huì)方面,生成式人工智能不僅深陷知識(shí)產(chǎn)權(quán)與信息泄露問(wèn)題,或也將塑造真正的信息繭房。“當(dāng)生成式人工智能24小時(shí)都陪伴你身邊,潛移默化地,你會(huì)誤認(rèn)為一切都是你自己的決定。”
趙星警示,“我們面對(duì)的,是一個(gè)會(huì)在短時(shí)間內(nèi)崛起,或?qū)⒁饑?yán)重后果且后果未知的事物。”
內(nèi)生安全治理:讓危機(jī)“已知”
面對(duì)生成式人工智能這個(gè)新對(duì)手,趙星認(rèn)為不能沿用傳統(tǒng)治理“被動(dòng)回應(yīng)外在威脅”的方法。相反,他的團(tuán)隊(duì)正在著眼于借助復(fù)旦大學(xué)大數(shù)據(jù)研究院院長(zhǎng)鄔江興院士提出的“內(nèi)生安全理論”,構(gòu)建生成式人工智能治理的新模型。
“我們能否在未知的風(fēng)險(xiǎn)爆發(fā)之前找到抵抗它的辦法?這是生成式人工智能內(nèi)生安全治理要解決的問(wèn)題。”趙星說(shuō),“我們需要在人工智能風(fēng)險(xiǎn)來(lái)臨前,給人類(lèi)社會(huì)點(diǎn)亮一棵新的技能樹(shù):應(yīng)對(duì)人工智能非傳統(tǒng)安全問(wèn)題的能力。”
生成式人工智能的治理模型涵蓋了三個(gè)層面。最外層是法律的監(jiān)督與規(guī)約,中間層是管理層的敏捷治理,尤為強(qiáng)調(diào)的最內(nèi)層是教育。在法律和政府治理之前,高等院校應(yīng)和所有的教育機(jī)構(gòu)一起,完成針對(duì)全人類(lèi)的社會(huì)性融合人工智能的教育和訓(xùn)練。
“我們應(yīng)當(dāng)在每一位年輕人的成長(zhǎng)過(guò)程中,讓他們學(xué)會(huì)如何與人工智能良好共處與規(guī)避‘信息繭房’,以及如何去做一個(gè)智能社會(huì)中的‘好人’。”
內(nèi)生安全治理模型的原理,是基于群體智能將個(gè)體“未知的未知”轉(zhuǎn)化為群體“已知的未知”,從而進(jìn)一步將其轉(zhuǎn)化為“已知的已知”。
“當(dāng)我們知道可能的風(fēng)險(xiǎn)是什么、產(chǎn)生在何處,生成式人工智能治理便有機(jī)會(huì)轉(zhuǎn)化為常規(guī)性安全問(wèn)題,我們就能?chē)L試尋求到治理閉環(huán)的實(shí)現(xiàn)。”趙星說(shuō),“然而這仍需要理論、實(shí)踐上長(zhǎng)期的探索。”
趙星團(tuán)隊(duì)也開(kāi)始探索生成式人工智能在科學(xué)評(píng)價(jià)中的應(yīng)用,創(chuàng)新構(gòu)建了“客觀數(shù)據(jù)、智能算法、專(zhuān)家評(píng)議”三者和諧共生的“數(shù)智人”評(píng)價(jià)與治理新范式。近期團(tuán)隊(duì)也在開(kāi)展利用類(lèi)ChatGPT工具進(jìn)行智能評(píng)價(jià)系統(tǒng)構(gòu)建的探索實(shí)驗(yàn)。
“初步結(jié)果顯示,雖然現(xiàn)階段的生成式人工智能遠(yuǎn)沒(méi)到能勝任學(xué)術(shù)評(píng)價(jià)這樣的嚴(yán)肅評(píng)價(jià)工作的程度,”趙星表示,“但生成式人工智能表現(xiàn)出的“跨學(xué)科”評(píng)價(jià)能力和“涌現(xiàn)”推斷預(yù)測(cè)潛力值得高度關(guān)注。”
- 免責(zé)聲明
- 本文所包含的觀點(diǎn)僅代表作者個(gè)人看法,不代表新火種的觀點(diǎn)。在新火種上獲取的所有信息均不應(yīng)被視為投資建議。新火種對(duì)本文可能提及或鏈接的任何項(xiàng)目不表示認(rèn)可。 交易和投資涉及高風(fēng)險(xiǎn),讀者在采取與本文內(nèi)容相關(guān)的任何行動(dòng)之前,請(qǐng)務(wù)必進(jìn)行充分的盡職調(diào)查。最終的決策應(yīng)該基于您自己的獨(dú)立判斷。新火種不對(duì)因依賴(lài)本文觀點(diǎn)而產(chǎn)生的任何金錢(qián)損失負(fù)任何責(zé)任。