首頁(yè) > AI資訊 > 最新資訊 > 大廠AI能問(wèn)出個(gè)人微信號(hào)?實(shí)測(cè)各大模型“吞吐”個(gè)人信息

大廠AI能問(wèn)出個(gè)人微信號(hào)?實(shí)測(cè)各大模型“吞吐”個(gè)人信息

21世紀(jì)經(jīng)濟(jì)報(bào)道    2024-12-13


21世紀(jì)經(jīng)濟(jì)報(bào)道記者肖瀟 實(shí)習(xí)生 崔嘉豪 袁清渠 北京報(bào)道

12月8日,一條關(guān)于字節(jié)跳動(dòng)旗下AI產(chǎn)品“豆包”的內(nèi)容在社交平臺(tái)引發(fā)爭(zhēng)議。一名網(wǎng)友發(fā)帖稱(chēng),陌生人通過(guò)豆包AI搜到了她的微信號(hào),還能通過(guò)AI查到自己的專(zhuān)業(yè)、考研成績(jī)、班級(jí)活動(dòng)等信息。

對(duì)此,21世紀(jì)經(jīng)濟(jì)報(bào)道記者聯(lián)系了豆包相關(guān)負(fù)責(zé)人,平臺(tái)回應(yīng)稱(chēng),豆包是基于互聯(lián)網(wǎng)上公開(kāi)信息進(jìn)行了搜索和智能整合,此類(lèi)聯(lián)系方式通過(guò)搜索引擎也能夠搜到。

豆包方面表示,目前已對(duì)詢問(wèn)個(gè)人信息類(lèi)提示詞進(jìn)行優(yōu)化,保證即使網(wǎng)上有公開(kāi)信息的情況下,仍然限制相關(guān)信息的露出,做好個(gè)人隱私信息的保護(hù)。后續(xù)將繼續(xù)調(diào)整產(chǎn)品策略,以避免對(duì)用戶造成困擾。

12月12日,記者對(duì)豆包、文心一言、通義千問(wèn)、Kimi四款國(guó)內(nèi)AI語(yǔ)言大模型進(jìn)行測(cè)試,發(fā)現(xiàn)已有部分大模型產(chǎn)品進(jìn)行了調(diào)整,限制與個(gè)人信息相關(guān)的回答。

不過(guò),這不是大模型第一次引發(fā)個(gè)人隱私爭(zhēng)議。當(dāng)信息被用于超出用戶預(yù)期的場(chǎng)景時(shí),催生了不安,AI產(chǎn)品的隱私策略面臨更復(fù)雜的挑戰(zhàn)。

根據(jù)當(dāng)事人對(duì)媒體的講述,陌生人是在豆包中輸入了“學(xué)校+姓名”,得到了她的微信號(hào)。豆包顯示,這條信息來(lái)源于一篇2023年的公眾號(hào)文章,當(dāng)時(shí)當(dāng)事人在為一個(gè)學(xué)生劇組招募現(xiàn)場(chǎng)演員,并在文章中留下了自己的微信聯(lián)系方式。

當(dāng)事人稱(chēng),自己已向豆包舉報(bào)了帶有微信號(hào)的回答,目前豆包不再返回相應(yīng)答案。不過(guò)輸入其他人的姓名和學(xué)校,還是可以獲得詳細(xì)的個(gè)人信息陳述。

豆包是字節(jié)跳動(dòng)旗下的AI聊天工具,能夠讓AI聯(lián)網(wǎng)總結(jié)信息。該產(chǎn)品于去年8月上線,字節(jié)跳動(dòng)產(chǎn)品和戰(zhàn)略副總裁朱駿在今年5月稱(chēng),豆包APP總下載量已突破1億次。

12月11日晚,21記者用類(lèi)似的方法對(duì)豆包、文心一言、通義千問(wèn)、Kimi四款國(guó)內(nèi)AI語(yǔ)言大模型提問(wèn)。從測(cè)試結(jié)果來(lái)看,大模型的回答能力與個(gè)人網(wǎng)絡(luò)曝光度相關(guān):如果一個(gè)人日常活躍、有網(wǎng)絡(luò)曝光度,AI的確能詳細(xì)陳述信息;反之則描述不出結(jié)果。

舉例來(lái)說(shuō),21記者輸入一名考研成功、曾在媒體實(shí)習(xí),且有豐富志愿經(jīng)歷的學(xué)生姓名,豆包能夠詳細(xì)描述其學(xué)術(shù)成果和成績(jī)表現(xiàn)。這種情況下,豆包的信息源是學(xué)校官網(wǎng)和媒體網(wǎng)站,包括學(xué)校公開(kāi)的自主招生成績(jī)、碩士錄取名單,媒體報(bào)道的團(tuán)支部志愿活動(dòng)。

在當(dāng)晚的測(cè)試中,只有阿里巴巴集團(tuán)旗下的通義千問(wèn)拒絕了提問(wèn)請(qǐng)求。通義千問(wèn)提示屬于個(gè)人隱私,建議用戶通過(guò)學(xué)校官網(wǎng)或領(lǐng)英等平臺(tái)查詢。

12月12日記者再次測(cè)試時(shí),豆包AI也調(diào)整了回復(fù),稱(chēng)未查到該學(xué)生具有顯著公開(kāi)事跡,回復(fù)縮減成了一百字左右的籠統(tǒng)概述。

目前幾款A(yù)I產(chǎn)品中,豆包在每條AI回答后提供了“舉報(bào)”選項(xiàng);通義千問(wèn)設(shè)置了“我要反饋”板塊,可以上傳圖片或填寫(xiě)問(wèn)題;文心一言與Kimi也提供“用戶反饋”板塊,但主要是針對(duì)產(chǎn)品提問(wèn),不能單獨(dú)上傳圖片。

根據(jù)記者實(shí)測(cè)和官方回應(yīng),AI之所以會(huì)輸出個(gè)人信息,是因?yàn)樽ト≌狭瞬煌W(wǎng)站的公開(kāi)信息,類(lèi)似升級(jí)版的搜索引擎。而爭(zhēng)議焦點(diǎn)在于:這種行為構(gòu)不構(gòu)成侵犯隱私?

上海申倫律師事務(wù)所律師夏海龍長(zhǎng)期從事個(gè)人信息及隱私保護(hù)領(lǐng)域,他告訴21記者,從法律上看,這種情況嚴(yán)格來(lái)說(shuō)并不構(gòu)成侵犯?jìng)€(gè)人信息。“從原理來(lái)講,這種檢索手段是合理合法的。從個(gè)人信息保護(hù)的角度,對(duì)于用戶主動(dòng)公開(kāi)的信息,我認(rèn)為這種整合式的輸出并不違反個(gè)人信息所有者公開(kāi)的目的,也是合理的。”

不過(guò),夏海龍也坦言,可以理解這一情況存在爭(zhēng)議。比如,有網(wǎng)友認(rèn)為,愿意公開(kāi)發(fā)布到公眾號(hào),并不代表自己愿意授權(quán)給AI總結(jié)。但夏海龍表示,微信公眾號(hào)本身也是公開(kāi)的網(wǎng)絡(luò)空間,屬于用戶自行公開(kāi)的行為。正常來(lái)講,只要不是通過(guò)破解入侵的方式獲取到公開(kāi)信息,都有一定合理性,也沒(méi)有違背用戶當(dāng)初信息公開(kāi)的目的。

類(lèi)似的隱私爭(zhēng)議在AI產(chǎn)品中屢見(jiàn)不鮮,情況也更為復(fù)雜多樣。梳理下來(lái),大概有三種場(chǎng)景:第一種是AI聯(lián)網(wǎng)搜出個(gè)人信息,也就是豆包的情況;第二種,AI收集個(gè)人信息用來(lái)訓(xùn)練模型;第三種,AI生成錯(cuò)誤的個(gè)人信息。

ChatGPT曾涉及后兩種問(wèn)題。2023年4月,ChatGPT因隱私泄露問(wèn)題在意大利被暫時(shí)封禁。OpenAI調(diào)查發(fā)現(xiàn),部分用戶的個(gè)人信息、聊天記錄和標(biāo)題,因?yàn)殚_(kāi)源庫(kù)出現(xiàn)漏洞而被錯(cuò)誤展示。

“ChatGPT是否按照其隱私政策,合法合理地收集并利用用戶個(gè)人信息?是否有效識(shí)別,并剔除了訓(xùn)練數(shù)據(jù)中‘偶然’包含的個(gè)人信息?這兩個(gè)問(wèn)題可能是爭(zhēng)議焦點(diǎn)所在。”大成律師事務(wù)所高級(jí)合伙人鄧志松此前向21記者分析。

鄧志松指出,ChatGPT的訓(xùn)練數(shù)據(jù)大量來(lái)自網(wǎng)上公開(kāi)的文檔、百科網(wǎng)站、個(gè)人問(wèn)答,這里面可能包含大量個(gè)人信息,而個(gè)人信息主體卻不知道自己的數(shù)據(jù)被用于訓(xùn)練大模型。未經(jīng)用戶許可擅自抓取并利用其個(gè)人信息,可能涉嫌違反所在司法轄區(qū)的個(gè)人信息保護(hù)法律法規(guī),并構(gòu)成民事侵權(quán)。

面對(duì)質(zhì)疑,OpenAI表示會(huì)盡力從訓(xùn)練數(shù)據(jù)集中刪除個(gè)人信息,微調(diào)模型以減少個(gè)人信息的輸出,并回應(yīng)用戶刪除個(gè)人信息的請(qǐng)求。但棘手的是,要逐一授權(quán)或刪除這些個(gè)人信息,成本和可行性都難度不小,這也是大模型在隱私保護(hù)上面臨的一大挑戰(zhàn)。

除此之外,今年4月,奧地利數(shù)據(jù)保護(hù)機(jī)構(gòu)收到一起針對(duì)ChatGPT的投訴,投訴其捏造用戶的錯(cuò)誤出生日期。這一行為被認(rèn)為違反了歐盟《通用數(shù)據(jù)保護(hù)條例》對(duì)個(gè)人信息準(zhǔn)確性的要求。OpenAI在隱私政策中表示,用戶可通過(guò)郵件申請(qǐng)更正生成的錯(cuò)誤信息,但由于技術(shù)復(fù)雜性,并非所有錯(cuò)誤都能被及時(shí)糾正。

個(gè)人信息的處理問(wèn)題也出現(xiàn)在本次事件中。當(dāng)事人提到,她在一篇公眾號(hào)文章中公開(kāi)了聯(lián)系方式,但該文僅上線一周便刪除,而豆包仍能檢索并總結(jié)相關(guān)信息。夏海龍分析,這涉及到我國(guó)《個(gè)人信息保護(hù)法》中關(guān)于“刪除權(quán)”的條款。當(dāng)用戶主動(dòng)從網(wǎng)上刪除了相關(guān)信息之后,AI服務(wù)商應(yīng)當(dāng)及時(shí)刪除信息,并同步到搜索結(jié)果中。

不過(guò),一位AI產(chǎn)品內(nèi)部人士告訴21記者,信息一旦公開(kāi)到互聯(lián)網(wǎng)中,很難被刪除干凈,這也是常見(jiàn)情況。

用戶可能不清楚到底還存在哪些公開(kāi)信息,而AI的檢索能力之強(qiáng)往往遠(yuǎn)超用戶預(yù)期。如何采用更完善的隱私保護(hù)策略,如何更好回應(yīng)公眾不安和隱私隱患,將是接下來(lái)AI產(chǎn)品需要直面的挑戰(zhàn)。


相關(guān)推薦
免責(zé)聲明
本文所包含的觀點(diǎn)僅代表作者個(gè)人看法,不代表新火種的觀點(diǎn)。在新火種上獲取的所有信息均不應(yīng)被視為投資建議。新火種對(duì)本文可能提及或鏈接的任何項(xiàng)目不表示認(rèn)可。 交易和投資涉及高風(fēng)險(xiǎn),讀者在采取與本文內(nèi)容相關(guān)的任何行動(dòng)之前,請(qǐng)務(wù)必進(jìn)行充分的盡職調(diào)查。最終的決策應(yīng)該基于您自己的獨(dú)立判斷。新火種不對(duì)因依賴本文觀點(diǎn)而產(chǎn)生的任何金錢(qián)損失負(fù)任何責(zé)任。

熱門(mén)文章