太魔幻了!DALL·E2居然能用自創的語言來生成圖像,AI模型的可解釋性再一次暴露短板
編輯|陳彩嫻
DALL·E 和 DALL·E-2從文本生成圖像的魔力,想必大家都已經見識過了。作為深度生成模型,它們能夠將文本作為輸入,生成匹配給定文本的超逼真圖像。不過,DALL·E-2 的一個眾所周知的局限性是它在生成帶文本的圖像時很吃力。例如,給出文本提示:Two farmers talking about vegetables,with subtitles.(兩個農民在談論蔬菜,有字幕)DALL·E-2 生成的圖像如下:
來自德克薩斯大學奧斯汀分校的博士生Giannis Daras 和 Alexandros G. Dimakis教授,發現DALLE-2背后竟然有一套秘密語言,模型內部似乎有一套隱藏的詞匯表,從這些隱藏的詞匯中,模型會學習一些單詞,并創造一些荒謬的文本提示來生成圖像。
比如,在DALL·E-2的語言系統里,Apoploe vesrreaitais意思是鳥類,Contarra ccetnxniams luryca tanniounons則表示昆蟲或害蟲。當你輸入這個句子作為文本提示時:Apoploe vesrreaitais eating Contarra ccetnxniams luryca tanniounonsDALL·E-2生成了下面這些圖像,圖像內容翻譯成英語,顯然是“A bird is eating a bug”(一只鳥在吃蟲子)

DALL·E-2 的秘密語言Daras 和 Dimakis 采用了一種簡單的方法來破解DALL·E-2的詞匯庫。比如,假設我們想找到在DALL·E-2的語言系統中,“ vegetables(蔬菜)”這個英語單詞對應的詞是什么,就可以用下面這些句子來提示DALL·E-2:A book that has the word vegetables written on it.(上面寫著“蔬菜”一詞的書。)Two people talking about vegetables, with subtitles.(兩個人在談論蔬菜,有字幕。)The word vegetables written in 10 languages.(以10種語言書寫的“蔬菜”一詞。)然后,DALL·E-2就會生成帶有表示“蔬菜”義的文本的圖像,比如在上面那張“兩個農民在談論蔬菜”的圖片中,DALL·E-2給出了自己的翻譯文本:Avcopinitegoos Vicootes, Apoploe vesrreaitais。下一步,我們就可以輸入DALL·E-2自己的詞匯,來看它會生成什么圖像。比如下圖(左)是從單詞“vicootes” 生成的圖像,下圖(右)是從短語 “apoploe vesrreaitais” 生成的圖像:









-它的語言模型是來自CLIP,所以問題一定是來自那個模型。
-我的理解是,它只在圖像上進行訓練,對吧?它用文本描述對圖像進行編碼,但它實際上從未 “看到 ”文本描述,除非圖像中恰好有文本。
-任何被索引到文本描述的圖像文本(或圖像文本的插值)都不會只是隨機的胡言亂語,這很有道理。有趣的是它如何對語言概念本身進行索引,以及它將它們混合在一起的能力。就像人類對語言的使用一樣。
剝其機理兩位作者對DALL·E-2的詞匯庫做了進一步的研究。詞匯組合性先來瞅瞅它的 Compositionality(組合性)。從前面的例子中,我們知道 "Apoploe vesrreaitais" 指“鳥類”。通過重復有關農民的提示的實驗,我們還可推測 “Contarra ccetnxniams luryca tanniounons”表示“害蟲或蟲子”。那么一個有趣的問題就來了,DALL·E-2能否把這兩個概念組成一個句子呢?如下圖所示 ,DALL·E-2可以將詞和短語組合成句子,根據 "Apoploe vesrreaitais eating Contarra ccetnxniams luryca tanniounons" 生成了鳥類在吃蟲子的圖像。不過這種情況不是發生在所有的生成圖像中,所以一致性并不是十分穩健。




安全性和可解釋性的挑戰有一種可能是,這些非人類現有語言的單詞是不同語言中正常單詞的拼寫錯誤,但兩位作者在搜索中沒有發現任何這樣的例子,所以這些詞的來源仍然令人困惑。而且在他們的初步實驗中,有些詞并不像其他詞那樣具有一致性,也就是說,目前DALL·E-2 的這套語言在從文本生成圖像時的穩健性可能不足。初步研究表明,像“Contarra ccetnxni ams lurycat anni ounons”這樣的提示有時會產生包含蟲子和害蟲的圖像(約占生成圖像的一半),每次還會產生不同的圖像,大部分是動物。而“Apoploe vesrreaitais”這個短語的一致性明顯更強,可以以各種方式組合來生成具有一致性的圖像。如果要測試更多提示語的穩健性,則需要大量的實驗。論文作者表示,如果一個系統表現出瘋狂的不可預測性,即使這種情況很少發生,也仍然是一個重要的問題,特別是對于一些應用程序而言。另一個有趣的問題是,Imagen是用語言模型訓練的,而不是CLIP,它是否也會有一個類似的隱藏詞匯庫呢?無論如何,生成圖像的荒謬提示挑戰了我們對這些大型生成模型的信心。顯然,在理解這些現象和創建穩健的、與人類預期相一致的語言和圖像生成模型方面還需要更多的基礎研究。更多細節,可參考論文原文:

參考鏈接:
https://twitter.com/giannis_daras/status/1531693111755149312https://www.reddit.com/r/MachineLearning/comments/v1zzh8/d_dalle_2_has_its_own_secret_language/
相關推薦
- 免責聲明
- 本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。 交易和投資涉及高風險,讀者在采取與本文內容相關的任何行動之前,請務必進行充分的盡職調查。最終的決策應該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產生的任何金錢損失負任何責任。