首頁 > AI資訊 > 行業動態 > 紐約時報送OpenAI、微軟上被告:GPT-4輸出結果與其作品有大量重復

紐約時報送OpenAI、微軟上被告:GPT-4輸出結果與其作品有大量重復

新火種    2024-01-04

機器之能報道

編輯:佳琪、大盤雞

在人工智能浪潮中,捍衛自己的權利。

當人工智能不斷興起,隨之而來的除了驚艷四座的強大技術,還有對技術的質疑以及各種規范的難題。

用什么作為訓練數據?是否得到許可?生成內容是否會造成侵權?這些問題都成為了人工智能發展路上必問的問題。涉及的相關案例,在未來也會指導司法實踐。

據彭博社報道,《紐約時報》已起訴微軟和 OpenAI,指控其侵犯版權,違規使用了《紐約時報》的內容用于人工智能開發。這場官司讓人們不得不正視媒體與顛覆性技術之間的關系。

據《紐約時報》的起訴書稱,這些技術公司使用了數百萬篇未經授權的版權文章用于訓練 ChatGPT 這樣的聊天機器人,而這種自動聊天機器人正在成為人們獲取可靠信息的來源,反過來搶新聞媒體的「飯碗」。

《紐約時報》沒有說明索賠的具體金額,但指出被告應該對「非法復制和使用《紐約時報》獨一無二的寶貴作品」造成的「數十億美元的法定和實際損害」負責,并要求這兩家公司銷毀所有使用《紐約時報》版權材料的聊天機器人模型和訓練數據。

圖片

在多數報紙和雜志都因為讀者紛紛轉戰互聯網而步履維艱時,《紐約時報》是少數在線上新聞業務中成功構建商業模式的媒體之一。而在生成式 AI 涌現的時代,傳統媒體更面臨著全新的挑戰。

ChatGPT 登場這一年來,關于其從網上抓取文本作為訓練數據的批評聲和質疑聲一直不絕于耳。今年九月,OpenAI 被美國作家協會指控,ChatGPT 參與了一場「大規模系統性的盜竊」。《紐約時報》的起訴是 OpenAI 首次受到一家主流媒體的挑戰。OpenAI 曾尋求得到版權方的授權,就像 Google 和 Meta 與 Facebook 的和解一樣。據稱,《紐約時報》曾于 4 月份聯系了微軟和 OpenAI,但未能達成一致。

「如果微軟和 OpenAI 想要將我們的作品用于商業目的,法律要求他們首先要獲得我們的許可,」《紐約時報》發言人在一份電子郵件聲明中說,「但他們沒有這樣做。」

OpenAI 發言人在一份聲明中表示:「我們尊重內容創作者和所有者的權利,致力于與他們合作,以確保他們受益于人工智能技術和新的收入模式。我們與《紐約時報》的持續對話富有成效,并且一直在積極推進,因此,我們對被起訴感到驚訝和失望。」微軟則拒絕置評。

7 月,OpenAI 與美聯社簽署了一項協議,獲取了該新聞機構的部分檔案的版權。12 月份,OpenAI 與 Axel Springer SE 簽署了一項為期三年的協議,以使用這家德國媒體公司的工作成果。

本周三,OpenAI 的發言人表示:「我們希望找到一種互惠互利的方式,像我們與許多其他出版機構一樣,攜手合作。」

即便如此,OpenAI 也已成為多起訴訟的目標,內容制作者不滿自己的作品被不當用于人工智能訓練。該公司面臨著喜劇演員 Sarah Silverman、《權力的游戲》作者 George R.R. Martin 和普利策獲獎作家 Michael Chabon 等文化名人的集體訴訟。

《紐約時報》的勝算

多家科技公司的首席法律顧問 Cecilia Ziniti 總結了《紐約時報》的制勝點。她稱這場官司是迄今為止指控生成式人工智能侵犯版權的最佳樣本。

圖片

首先,申訴書明確指出了被告方的侵權行為。被告有機會接觸到原作,并且原告和被告之間的作品存在「實質性相似」。這兩點是判定是否存在侵權行為的關鍵。而《紐約時報》是用于訓練 GPT 的 Common Crawl 中最大的專有數據集,證明 ChatGPT 的輸出和《紐約時報》的內容既存在接觸途徑,也存在「實質相似」。

其次,申訴書中提供了一看就懂的抄襲證據。下圖中,紅色是完全重合的文本,黑色是 GPT 新生成的文本,大量重復將一目了然。Ziniti 認為,除非 OpenAI 對 GPT 訓練方式作出大調整,或者通過大量的法律手段說明技術原理,否則 OpenAI 根本無力辯護。選擇和解比繼續對抗更加明智。

圖片

《紐約時報》的聰明之處還在于他們突出了一篇新聞報道的原創過程。一篇調查出租車貸款的深度報道的背后是記者四處走訪,采訪 600 余次的不懈努力。版權法守護的雖然不是勞動者「額頭上的汗水」,但它守護原創者的智慧和創造力。對比 GitHub Copilot 被超過一千萬名程序員告上法庭時,他們只引用了幾行開源代碼,這個保護創新的說服力就沒那么強。(注:額頭汗水是一個著作權保護法的著名案子,美國聯邦最高法院在「費斯特案」中認為只保護人類「額頭上的汗水」—— 勞動,這種思路將損害著作權法的基本原理)

此外,4 月份,OpenAI 和《紐約時報》談判破裂后,獲得了《政客報》等其他媒體的授權,這對《紐約時報》的利益造成了損害。隨著 OpenAI 的市值增長和越來越多的抄襲案例出現,拒絕與《紐約時報》和解,OpenAI 可能會付出高昂的代價。Ziniti 對 4 月份的談判作出了大膽推測:OpenAI 方認為他們可以用幾百萬或幾千萬美元來擺脫困境,而《紐約時報》想要的更多,以及持續的版稅。

據分析,「CloseAI」的不利形象也將對 OpenAI 面對指控產生影響。《紐約時報》將 OpenAI 描述成一個以盈利為目的的閉源組織,這與為公共利益服務的新聞業形成了巨大的對比。審判需要權衡版權保護與技術創新兩者帶來的社會效益。在版權案件中,「正義與邪惡」的斗爭一直都是爭議的焦點。而代表正義一方的敘事在法庭上往往更容易奏效。申訴書中還提到了 OpenAI 董事會和 Sam Altman 的「宮斗戲」,不知道「連續劇」是否為 OpenAI 的形象蒙塵。

圖片

最后,人們對大模型幻覺問題的恐懼會讓案情更加跌宕起伏。《紐約時報》指控 Bing 稱《紐約時報》發表了一篇名為「橙汁導致淋巴瘤」的文章,但實際上《紐約時報》從來沒寫過這篇報道。這無疑將 OpenAI 置于更加不利的地位。

這場官司可能是人工智能和版權領域的一個轉折點。

后續影響

據彭博社上周報道,OpenAI 目前正在與投資者洽談新一輪融資,估值將達到 1000 億美元,這將使其成為美國估值第二高的初創企業。

圖片

微軟是 OpenAI 最大的支持者,并在其多個產品中部署了這家初創公司的 AI 工具。在訴訟中,《紐約時報》稱微軟在其必應搜索引擎中逐字抄襲了該報的文章,并利用 OpenAI 的技術將其價值提升了一萬億美元。

自 2022 年 11 月 ChatGPT 首次亮相以來,微軟股價已上漲 55%,市值增至 2.8 萬億美元。周三,微軟股價變化不大,在紐約以 374.07 美元收盤。接下來,微軟的股價是否會有大的變動,還未可知。

Abacus.AI CEO Bindu Reddy 發文表示,或許最后獲益最大的是像 Gork 這樣的產品。畢竟,通過允許用戶在其平臺上發布內容,他們就能獲得用這些內容訓練人工智能模型的權利。

圖片

其實,在文生圖領域這樣的難題也照樣存在。甚至有用戶表示,不想再看到 AI 生成圖像的推薦了,并以「尸塊」拼接定義 AI 作畫。

圖片

事實上,文生圖工具 Dall?E 3 在發布時就格外注意安全與版權問題。OpenAI 為避免像 Stability AI 和 Midjourney 一樣被訴訟,允許藝術家將其藝術作品從文本到圖像 AI 模型中刪除,不用于訓練。創作者可以提交一張他們擁有版權的圖片,并在網站上填寫表格要求將其移除。但這樣的措施是否能夠完全保護創作者的權利不被侵犯,依舊是個問題。

相關推薦
免責聲明
本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。 交易和投資涉及高風險,讀者在采取與本文內容相關的任何行動之前,請務必進行充分的盡職調查。最終的決策應該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產生的任何金錢損失負任何責任。

熱門文章