首頁 > AI資訊 > 行業(yè)動態(tài) > 字節(jié)跳動實習(xí)生投毒自家大模型:全刪了

字節(jié)跳動實習(xí)生投毒自家大模型:全刪了

新火種    2024-10-19

10月19日,字節(jié)跳動大模型訓(xùn)練遭實習(xí)生攻擊一事引發(fā)廣泛關(guān)注。據(jù)多位知情人士透露,字節(jié)跳動某技術(shù)團(tuán)隊在今年6月遭遇了一起內(nèi)部技術(shù)襲擊事件,一名實習(xí)生因?qū)F(tuán)隊資源分配不滿,使用攻擊代碼破壞了團(tuán)隊的模型訓(xùn)練任務(wù)。

字節(jié)跳動實習(xí)生投毒自家大模型:全刪了圖|來源于網(wǎng)絡(luò)

據(jù)悉,該事件的主要涉事者為一名田姓實習(xí)生所為,他利用了Huggingface(HF)平臺的漏洞,在公司的共享模型中寫入了破壞代碼,導(dǎo)致模型訓(xùn)練效果忽高忽低,無法產(chǎn)生預(yù)期的訓(xùn)練成果。

一位前字節(jié)技術(shù)員工表示,“字節(jié)AI Lab的實習(xí)生權(quán)限和正職員工差異不大,也使得此次事件有了發(fā)生的機會”,其也對此次事件帶來的惡性影響表達(dá)了擔(dān)憂,“這件事之后肯定會極大地收縮實習(xí)生的權(quán)限”。

在消息曝出后,該名涉事實習(xí)生試圖在社交平臺上辟謠,將責(zé)任推給他人,不過很快便遭到了接近字節(jié)跳動人士的否認(rèn)。

據(jù)相關(guān)知情人士在Gitbub上表述,“你(指田某)在長達(dá)2個月的時間里對集群代碼進(jìn)行惡意攻擊,對公司近30位各級員工造成巨大傷害,讓你的同事近一個季度的工作白費。所有的記錄和審查都證明這是不容狡辯的事實!”

該名人士還分享了一則調(diào)查人員對田姓實習(xí)生 (TianKeyu)的詢問錄音,錄音中的對話還原其攻擊的過程:田某最先輸入的code本來是被用于影響通訊和隨機性的,“最開始的時候它并不是以攻擊為目的,它是為了debug,但這確實會涉及到程序的一些運行情況。但是后面它經(jīng)過一些文件,就是那些upload文件,code也會被update,code就變成了攻擊code。它大概的作用就是去修改code,然后就會造成一些后果。”

錄音中疑似田某本人的回應(yīng)承認(rèn)了其通過update使得code帶有了攻擊性。其也對問詢?nèi)藛T明確表示,“就是因為某些原因?qū)е铝宋覀兌挤浅2粷M”。

另據(jù)傳聞稱此次損失可能超過千萬美元,但內(nèi)部人士表示實際損失并沒有傳聞中那么嚴(yán)重。

據(jù)了解,該事件發(fā)生于今年6月底,目前字節(jié)跳動已對田姓實習(xí)生采取了辭退處理,并將此事通報給相關(guān)行業(yè)聯(lián)盟和該實習(xí)生所在的學(xué)校。

不過前述相關(guān)知情人士表示,除了被字節(jié)辭退,田某目前未受到任何處罰。

多方消息顯示,田姓實習(xí)生為國內(nèi)某高校在讀博士生,于2021年9月起在字節(jié)AI Lab實習(xí),其所在的團(tuán)隊剛在今年4月與北大王立威團(tuán)隊提出了VAR研究,在圖像生成質(zhì)量、推理速度、數(shù)據(jù)效率和可拓展性等方面均超過了DiT。此外,VAR的推理速度比傳統(tǒng)自回歸模型快了約20倍。

字節(jié)跳動實習(xí)生投毒自家大模型:全刪了

文章內(nèi)容舉報

相關(guān)推薦
免責(zé)聲明
本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應(yīng)被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認(rèn)可。 交易和投資涉及高風(fēng)險,讀者在采取與本文內(nèi)容相關(guān)的任何行動之前,請務(wù)必進(jìn)行充分的盡職調(diào)查。最終的決策應(yīng)該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產(chǎn)生的任何金錢損失負(fù)任何責(zé)任。

熱門文章