硬剛谷歌、微軟Reddit堅持數據收費或將封殺搜索引擎爬蟲
《科創板日報》10月23日訊 據《華盛頓郵報》上周五報道,聚合新聞類網站Reddit正與AI巨頭商討數據付費事宜,如果雙方無法達成協議,Reddit可能會切斷面向谷歌、必應的服務,即禁止谷歌、必應等搜索引擎的爬蟲從平臺內獲取內容。
這將迫使用戶登錄Reddit賬號才能獲取到自己想要的信息。也就是說,Reddit的內容將不會顯示在谷歌和必應的搜索中。
對此,《華盛頓郵報》隨后的糾正報道,以及The Verge的最新報道指出,Reddit否認了上述報道中關于“強制用戶登錄平臺,才能查看內容”的說法,至于“封殺搜索引擎爬蟲”,官方并未否認。消息人士還稱,“沒有搜索(網站),Reddit也能生存。”
Reddit是美國人最常訪問的新聞網站,用戶可以在其中創建并分享內容,有“美國版百度貼吧”之稱,目前Reddit擁有超過13萬個活躍社區,根據該公司2020年底的數據,其擁有超過15億注冊用戶,4.3億月度活躍用戶,以及5200萬日活躍用戶。
訓練AIGC工具需要海量數據,而Reddit積累了大量用戶生成內容,均是AI優質訓練數據,這家公司由此覓得商機。
4月份,Reddit宣布,將向使用其API訓練AI聊天機器人的公司收取數據使用費,其中便包含微軟、谷歌、OpenAI等;6月份,其高于行業平均水平的收費標準被爆出——每5000萬次API請求收取1.2萬美元。
如果說龐大的數據資產為Reddit提供了收費的可能性,其上市計劃則提示了Reddit進行收費的必要性。
此前知情人士說,Reddit的目標是在今年晚些時候最終上市——很可能是在下半年。Reddit和包括Instacart在內的其他公司正在更新他們的IPO文件,為市場狀況好轉時可能的IPO做好準備。
▌多方施壓AI巨頭 數據免費時代告結?
當下,AIGC浪潮正席卷坐擁數據資產的公司,Reddit、X(前身為Twitter)等公司待價而沽。據了解,X的定價比Reddit更高,據WIRED此前報道,X提供的套餐中最便宜的為:每月支付4.2萬美元可以訪問5000萬條推文。
報紙出版商為代表的公司選擇高筑城墻。《華盛頓郵報》報道稱,自8月以來,至少535家新聞機構(包括《紐約時報》、路透社和《華盛頓郵報》)安裝了攔截器,以防止其內容被OpenAI等公司抓取,用于訓練ChatGPT等產品。
其目的是相同的——希望在AIGC市場中分一杯羹。據Semafor7月報道,擁有TheDailyBeast的媒體集團IAC試圖建立一個出版商聯盟,旨在通過訴訟或立法行動從AI公司贏得數十億美元。8月,NPR報道稱《紐約時報》也在考慮對OpenAI提起訴訟。
除了大公司的收費要求,大型AI公司還面臨著來自個人的壓力,大量作者、藝術家和軟件程序員正向其提出版權訴訟,要求賠償侵權損失并分享利潤。據路透社此前報道,前阿肯色州州長MikeHuckabee已作為原告加入了對Meta、微軟和彭博社的集體訴訟,指控他們使用盜版書籍來訓練AI。
彭博稱,到2032年,這一市場(數據收費市場)預計將達到1.3萬億美元。
當然,收費背后,不僅僅是錢的問題,許多公司將數據使用視為一個關乎生存的問題,擔心AI用自家數據學到了東西,轉而挖走自己的用戶。如針對程序員的問答平臺Stack Overflow的首席執行官PrashanthChandrasekar表示,OpenAI推出GPT-4一個月后,隨著程序員轉向AI尋求編碼問題的答案,編碼社區Stack Overflow的流量下降了15%,他認為人工智能已經接受了Stack Overflow數據的訓練。
最新消息顯示,Stack Overflow已經裁員28%。
目前,無論是傳媒集團還是主流社交平臺,仍然在與AI巨頭“拉鋸”,最終是否需要付費、如何收費,不同話語權的公司將得到不同的結果。
- 免責聲明
- 本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。 交易和投資涉及高風險,讀者在采取與本文內容相關的任何行動之前,請務必進行充分的盡職調查。最終的決策應該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產生的任何金錢損失負任何責任。