文化大數據&文化大模型業態匯
文化大數據&文化大模型業態匯
在當今數字化時代,數據已經成為推動社會發展的重要引擎。文化產業作為國民經濟的重要組成部分,也面臨著數字化轉型的機遇和挑戰。如何釋放數據生產力,激活文化數據資源流通,成為當前文化產業亟待解決的問題。
為了深入探討這一問題,2024文化和科技融合生態大會同期活動之一,文化大數據&文化大模型業態匯將于10月24日9:00-17:00在南京華山飯店牡丹廳盛大舉行。
本次大會以“釋放數據生產力,激活文化數據資源流通”為主題,旨在匯聚行業智慧,探索文化產業數字化轉型的新路徑。
大會將邀請各細分領域龍頭企業,比如專注古籍數字化領域的北京掃葉科技、專注數據流通領域的貴州數據寶、專注出版領域的北京世紀超星、專注數據訓練與標注的數據堂、聚焦文獻數字化的同方知網、專注計算與教育領域的同方有云、人工智能知名企業思必馳等,同時還將邀請四川省文化大數據有限責任公司、安徽省文化大數據有限責任公司、江蘇省廣電有線信息網絡股份有限公司、南京大數據集團有限公司、杭州智先行科技有限公司、湖南海川數字運營管理有限公司等文化大數據領域代表性企業齊聚一堂,分享成功案例和經驗,展示數據要素的應用成果,為產業發展提供實踐參考。
流動的數據才能發揮更大的價值,發展數字經濟、建設數字中國,要以數據要素的充分流轉為基礎。如何發揮文化產業中數據要素的真正價值?
“文化科技融合匯”提前探秘,為你分享文化大數據的采集、確權、標識、流通、運用等領域的優秀企業,希望能給你啟發!
數據采集
打牢文化數字化的“數據基石”
近幾年,中國數字文化集團在數據的采集上收益頗豐,在蘇州、保定、武漢等地建立了國家文化大數據采集與展示基地,與當地文化旅游局共同探索文化產業數字化發展新路徑。
江蘇衛視記者探訪國家文化大數據江南采集基地
以中國數字文化集團全資子公司中數文化大數據(蘇州)有限公司在蘇州建立的“國家文化大數據江南采集基地”為例,該基地針對歷史文化資源、非遺文化資源、新文化資源以及文化生態資源四大類別,以蘇州為中心,輻射長三角,開展數字化采集和數據處理,通過建立數據庫并入國家文化專網進行全國和全球分發。
福建廣電網絡集團依托已建成的國家文化大數據福建中心一期,在完成古田會議紀念館紅色基因庫、省博物院中華文化數據庫、閩臺緣博物館中華文化遺產標本庫等數據采集試點的基礎上,進一步匯聚漁業、船政、海洋等領域文化數據資源,上線“海韻”優秀文化視頻出海平臺,推進海洋文化數據庫建設,助力海絲文化傳承發展。開展了朱子文化數據庫建設,共計征集南平、三明、泉州、漳州等地朱子文化相關文物、遺址、影音資料、出版物資源數據近千條,同步高精度數據采集上百條,完成數據結構化集中存儲。
新維暢想的微痕提取采集技術,可在對文物本體無接觸的前提下以超越人眼識別的超高精度采樣技術,實現對目標文物空間集合信息的高精度提取,可以提高文化信息識別率高達30%-80%,讓“已經消失”的文物信息得以重現。
數據確權
夯實數據要素市場繁榮的基礎
目前國內數據要素的發展還處在初級階段,數據確權作為鏈上核心的環節至關重要。特別是全球AI侵權糾紛頻發、國內《生成式人工智能服務管理暫行辦法》發布的大背景下,合理使用正版數據是大勢所趨。
中文在線集團通過整合高質量數據、強化版權服務、構建版權聯盟,建立了數字內容版權保護體系。在整合高質量數據方面,中文在線集團已形成高質量數據一體化開發體系,擁有數據整合能力、數據運維能力和數據服務經驗。在強化版權服務方面,公司用技術創新賦能版權保護,已開啟以區塊鏈技術為底層知產保護邏輯、向上延伸至版權溯源與交易平臺雙線并行業務模式。在構建版權聯盟方面,自2005年成立反盜版聯盟至今,公司已主導內外部維權案件超萬件,涉案著作權作品10萬余部,累計獲賠金額數億元,為數千權利人提供知識產權服務。
中視瑞德自主研發的版權管理系統采用獨創的版權權利數據魔方體系(CMCS),可根據不同行業、不同客戶的特點,定制化研發高度契合客戶業務形態的版權管理系統,將錄入的版權數據匯合成龐大的版權信息數據庫,系統具備全流程管理、精細化管理、版權預警、可視化大數據分析等智能手段,為版權資產的開發利用提供了重要信息支撐,幫助客戶實現厘清自身家底、促進版權資產增值的目標。
作為全國出版集團中唯一入選國家“區塊鏈+版權”特色領域試點的單位,海峽出版發行集團將繼續積極推進海峽區塊鏈版權綜合運營中心項目建設,順利通過階段性中期評估。目前,已建成包含版權登記前置工作站、“元犀宇宙”數字藝術平臺和“元犀世界”數字拍賣平臺3大業務模塊,實現了版權由登記、認證、查詢、開發利用、銷售推廣和轉讓交易全生命周期的閉環操作。
數據標識
讓文化大數據“流得動”
中國公共關系協會文化大數據產業委員會設立了國家文化大數據標識注冊中心,制定了《國家文化大數據標識注冊中心管理辦法(試行)》,并得到了信息與文獻國際標準關聯標識符(ISLI)國際注冊機構的授權。
2023年文化科技融交會的同期活動“文化大模型開發應用大會”上的第二批“國家文化大數據標識基地”授牌儀式
中國數字文化集團目前已建成國家舞臺藝術影像庫、中國傳統音樂庫、中國大學生優秀數字藝術作品庫、《偉大征程》藝術檔案庫、世界音樂資源庫、世界樂譜資源庫、世界美術資源庫、非物質文化遺產庫等8個主數據庫、69個子庫,300個文化資源數據集(持續擴建中),14萬余文件資源數據上傳并關聯至國家文化大數據底層關聯系統。京劇類數據資源庫標識案例
雅昌文化集團通過領先行業的數據采集編輯能力、專業的數據治理能力、前沿的IT技術研發能力、多元的場景數據展示應用策劃制作能力,運用數據可視化、3D技術和交互技術,構建數量龐大、結構規范、形式多樣的體系框架,實現藝術品、藝術家和藝術數據的交互關聯展示,多維度、全方位呈現數據內容,最大化拓展數據展示形式。雅昌文化集團的“中國藝術數據庫”
數據交易
加速數據的共享與流通
在國家文化大數據體系架構上,交易扮演著十分重要的角色——既是資源與生產的中介,又是生產與消費的中介。針對目前數據交易所存在的交易不活躍等問題,文化數據交易倡導“一碼通”,即交易主體及其交易標的被賦予唯一的關聯標識符(ISLI碼),憑碼交易、拼碼結算。文化數據交易由買賣雙方在“數據超市”完成交易,文化產權交易所提供第三方交割,交割完成后“點對點”交付數據,以確保數據安全。由深圳文化產權交易所承建的全國文化大數據交易中心充分發揮在場、在線交易平臺優勢,以提高交易效率為目標,接通國家文化專網,疏通供給和需求,鏈通生產和消費,暢通信息流、資金流,推動標識解析與區塊鏈、大數據等技術融合創新,為文化資源數據和文化數字內容的確權、評估、匹配、交易、分發等提供專業服務。湖南大數據交易所“文化大數據交易中心”是湖南大數據交易所下設的文化數據資產流通全鏈路機構,將打通從數據歸集、加工、交易到應用的產業生態閉環,為湖南和長沙產業數字化、數字產業化提供重要支撐。由江蘇文化產權交易所承建的華東區域交易平臺連接了的國家文化大數據標識基地及文化數據庫,連通國家文化大數據標識注冊中心,并在交易平臺上設置有文創專區、文旅專區、文博專區等,可為各類文化生產機構、數據應用場景提供一站式解決方案。數據應用
文化大數據的多場景落地
從2022年3月起步,南京文投集團積極踐行國家文化數字化戰略,在全國率先開啟城市文化數字化探索,率先發布中國城市文化數字化整體解決方案,被新華社評為“全國首個,文化數字化的南京樣本”。
2024年持續精進,在多方大力支持下,正式發布文都數字云平臺3.0版——文都智腦,搭建四層架構體系。基礎層
發布國內首個城市文化大數據基座,包括文樞大數據、文都區塊鏈、長干大模型、金陵元宇宙,加快推進數據供應鏈、數據產業鏈、數據價值鏈、數據創新鏈的“四鏈深度融合”。
應用層
建設品史、攬博、看劇、服務、賞景、有禮、觀展、遛娃、探元等九大新場景,推出 “文都智腦”、“攬博南京”“我的南京”等線上入口以及文學之都空間網絡、南京文化新質生產力實驗室等線下入口。
放大層
建好產學研平臺——江蘇文都創意城市研究院、投資平臺——文都產業基金、展會平臺——中國文化科技融交會、伙伴平臺——南京元宇宙產業協會。
產出層
瞄準新基建平臺研發、新文化場景打造、新入口平臺建設、新產業股權投資四大產業方向,形成可持續發展的產業閉環。
今年6月,南京市檔案館和南京大數據集團共同開發的非遺檔案文化平臺“金陵檔案—蘭臺拾遺”應用系統在“我的南京”APP正式上線。“金陵檔案·蘭臺拾遺”應用頁面
近年來雙方發揮各自優勢,率先在國內開展非遺檔案數據資產轉化開發的有益探索,實施非遺檔案搶救性保護工程,建成南京云錦、南京金箔兩大類非遺檔案專題數據庫。僅云錦檔案數據庫就收存了7000余件文書檔案、264幅云錦實物和956幅意匠稿的目錄和全文數據。在城市門戶“我的南京”APP全新上線的“金陵檔案·蘭臺拾遺”應用系統,從多維度生動展示南京云錦、南京金箔等檔案史料、圖片、視頻、展陳等編研成果,讓社會公眾充分領略非遺魅力,感受非遺之美。另外,文化大數據的應用為文化產業帶來了前所未有的機遇和挑戰,文化大模型應運而生。在2023中國(南京)文化和科技融合成果展覽交易會的同期活動“文化大模型開發應用大會”上,展示了基于文化大模型開發應用的示范案例和相關工具等。文化大模型是基于華為盤古大模型而開發的。華為的盤古大模型是一個基礎大模型,主要作用就是做好海量基礎知識的學習,可以形象地理解為“讀萬卷書”。在此基礎上依托行業伙伴的專業數據打造行業模型和場景模型,可以稱作“行萬里路”。文化大模型是在基礎大模型的基礎上形成的行業模型,文化機構再基于文化大模型開發專業模型,也就是場景模型。
以下為企業具體應用場景——
中國數字文化集團通過文化大模型,可對海量文化資源數據進行過濾,將重復、冗余、弱相關的旁支數據自動篩除。文化大模型強大的自然語言理解、智能圖像識別、圖文生成與圖文轉化功能,還能直接對文化資源數據的文字描述和圖像內容等要素進行理解和識別,自動抓取關鍵詞并智能產出對應的檔案標簽,自動進行數據分類。
雅昌文化集團運用盤古大模型的CV視覺模型、多模態模型,可以智能化解決圖片智能校色、老照片智能修復、圖片智能搜索、跨內容的智能標注/關聯、以圖識文、藝術品價格評估、藝術品鑒定、智能設計、智能排版、構建知識圖譜等。
北京世紀超星信息技術發展有限公司在文化大模型評測階段進行了四方面探索:打造知識圖譜自動生成功能,提升時間和效率;打造模糊查詢、圖片檢索;查重與分析,實現對文字與圖片、圖片與視頻與音頻的查重;智能歸類,根據讀者平時個人喜好,根據閱讀習慣等進行分類和排序,方便讀者查詢。
南京水晶石數字科技有限公司與中國長城研究院及民博智慧(北京)科技有限公司合作打造的長城數字化綜合體驗平臺,是國內第一個運用數字化手段全面復原、展示、保護和研究長城遺址的應用平臺。智慧旅游發展大會暨智慧旅游示范展示活動上的“中國長城三維交互數字地圖項目”
該項目以三維立體動態數字地圖沙盤的形式多維度、多時空展示了歷代長城的演變,觀眾可隨意點擊旋轉放大縮小,進行互動查詢。同時,三維立體數字沙盤上標注有歷代長城相關的“烽燧、驛站、戍堡、關隘、塹壕、長墻、敵樓”等遺址,觀眾可以點擊查看相關遺址點及周邊文旅信息,實現VR體驗、AI語音交互、實景空中漫游以及與三維復原模型互動。- 免責聲明
- 本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。 交易和投資涉及高風險,讀者在采取與本文內容相關的任何行動之前,請務必進行充分的盡職調查。最終的決策應該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產生的任何金錢損失負任何責任。