100萬本公共領域書籍,為AI訓練提供合法數據
導語:AI 訓練所需的數據成本高昂,但卻更適合資金充裕的科技公司。IT之家 12 月 13 日消息,據 TechCrunch 12 日報道,哈佛大學與谷歌宣布,聯合發布 100 萬本公共領域書籍作為 AI 訓練數據集。AI 訓練所需的數據成本高昂,但卻更適合資金充裕的科技公司。因此,哈佛大學計劃發布
導語:AI 訓練所需的數據成本高昂,但卻更適合資金充裕的科技公司。IT之家 12 月 13 日消息,據 TechCrunch 12 日報道,哈佛大學與谷歌宣布,聯合發布 100 萬本公共領域書籍作為 AI 訓練數據集。AI 訓練所需的數據成本高昂,但卻更適合資金充裕的科技公司。因此,哈佛大學計劃發布
【新華社微特稿】多名作家指控美國“元”公司在其首席執行官馬克·扎克伯格批準下,使用盜版書籍來訓練人工智能(AI)系統。據路透社9日報道,塔奈希西·科茨、薩拉·西爾弗曼等作家2023年就曾起訴“元”公司,稱這家科技巨頭濫用他們的作品來訓練其Llama大型語言模型。不過,相關指控去年被美國加利福尼亞州聯
1月14日消息,據國內媒體報道,Meta最近因使用數千本盜版書籍訓練人工智能模型存在法律風險而引發版權侵權訴訟。據悉,Meta使用大量盜版書籍的“Books3”數據集訓練其LLAM 1和LLAM 2模型,Meta雖承認使用了 Books3 數據集,卻拒絕向作者支付適當的補償。