首頁 > AI資訊 > 最新資訊 > 鳳凰大模型數(shù)據(jù)研討沙龍在京舉辦,鳳凰衛(wèi)視推出全新AI數(shù)據(jù)業(yè)務

鳳凰大模型數(shù)據(jù)研討沙龍在京舉辦,鳳凰衛(wèi)視推出全新AI數(shù)據(jù)業(yè)務

新火種    2023-11-23

11 月 13 日,“數(shù)聚未來 —— 鳳凰大模型數(shù)據(jù)研討沙龍” 成功在京舉行,鳳凰衛(wèi)視執(zhí)行副總裁兼運營總裁李奇,微博COO、新浪移動 CEO、新浪AI媒體研究院院長王巍,華為EI產(chǎn)品部部長尤鵬,智譜AI副總裁劉佳,MiniMax副總編輯蘇彤等多位行業(yè)代表出席本次論壇,共同探討高質(zhì)量數(shù)據(jù)構建與基于數(shù)據(jù)驅(qū)動的大模型訓練優(yōu)化。

期間,鳳凰衛(wèi)視正式推出“鳳凰智媒AI數(shù)據(jù)業(yè)務”,并發(fā)布首批 “中文訪談對話數(shù)據(jù)集” 和 “正向價值對齊數(shù)據(jù)集”。鳳凰數(shù)據(jù)的核心目標是推動AI數(shù)據(jù)領域華語數(shù)據(jù)的豐富與共享,同時為中華文化的傳承與傳播提供AI時代的探索思路和解決方案,讓AI與中華文化認知對齊更簡單。

數(shù)據(jù)產(chǎn)業(yè)的發(fā)展需要AI領域各方同仁共同參與

鳳凰衛(wèi)視執(zhí)行副總裁兼運營總裁李奇在致辭中表示,數(shù)據(jù)仍然是目前人工智能發(fā)展的短板之一。數(shù)據(jù)就像是人工智能時代的石油資源,它的開發(fā)和應用都將是一個系統(tǒng)工程,需要產(chǎn)業(yè)界無數(shù)企業(yè)共同參與。鳳凰衛(wèi)視作為一個立足香港、背靠內(nèi)地、面向全球發(fā)展的國際媒體,也將是人工智能時代的積極參與者,期望發(fā)揮鳳凰的媒體平臺優(yōu)勢,為產(chǎn)業(yè)界建立一個共建共享的數(shù)據(jù)平臺,共同推進人工智能的快速發(fā)展。

微博COO、新浪移動CEO、新浪AI媒體研究院院長王巍在主旨演講《數(shù)據(jù)賦能:微博探索AIGC多場景應用》中提出,圍繞大模型,目前已經(jīng)形成由基礎設施層、模型層、應用層共同構成的AIGC生態(tài)體系。對于媒體而言,AIGC將帶來內(nèi)容生產(chǎn)方式的變革,AIGC 時代的內(nèi)容質(zhì)量、效率及產(chǎn)量都將迎來高速發(fā)展。在未來,AI將創(chuàng)造出一種新型的“人機共存消費模式”。

智譜AI副總裁劉佳帶來《ChatGLM3: 模型、平臺與應用》的主旨演講。劉佳表示,隨著 2020 年 ChatGPT 的問世,生成式 AI 步入 “第一階段”。而在當前,市場已進入 “第二階段”,生成式 AI 開始在千行百業(yè)落地。劉佳形容說,之前我們找到了錘子,現(xiàn)在我們要發(fā)現(xiàn)更多的釘子,讓大模型的能力應用落地。

華為云EI產(chǎn)品部部長尤鵬帶來《盤古大模型的數(shù)據(jù)之道》的主旨演講。尤鵬表示,華為希望和鳳凰衛(wèi)視一起共建數(shù)據(jù)黑土地,共同探索產(chǎn)業(yè)界自下而上的數(shù)據(jù)合作路徑和商業(yè)模式,共同構建大模型的“數(shù)據(jù)-算力-商業(yè)”飛輪,推動數(shù)據(jù)產(chǎn)業(yè)發(fā)展。

中國科學院信息工程研究所研究員張瀟丹介紹了 “正向價值” 對于大模型的重要性。她表示,雖然大模型正處在蓬勃發(fā)展的時代,但也存在諸多風險因素,比如虛假信息的生成、語言偏見等,這些風險源自于訓練數(shù)據(jù)的偏頗、模型自身邏輯缺陷及缺乏糾錯能力等,因此亟需建立大模型的正向價值體系。

MiniMax 副總編輯蘇彤分享了《大模型應用落地與安全管理探索》的主旨演講。百度、京東、螞蟻、360、知乎、曠視、中科聞歌、蜜度、面壁智能等業(yè)界廠商代表也出席了此次論壇活動。

行業(yè)專家共同探討大模型未來挑戰(zhàn)與機會

除主旨演講外,香港科技大學 (廣州) 協(xié)理副校長熊輝,視覺中國創(chuàng)始人、總裁柴繼軍,商湯科技數(shù)字文娛總經(jīng)理欒青,中科聞歌創(chuàng)始合伙人兼 CTO 曹家參加了《“與未來對話” 大模型下一階段的落點挑戰(zhàn)與機會》圓桌論壇,各位來賓就自身領域發(fā)表了精彩見解,磐霖資本風險合伙人、獨到科技聯(lián)合創(chuàng)始?兼CTO陳利人擔任主持人。

香港科技大學 (廣州) 協(xié)理副校長熊輝指出,雖然算力是行業(yè)公認的中國大模型面臨的挑戰(zhàn)之一,但在他看來,真正的挑戰(zhàn)是數(shù)據(jù)。雖然國內(nèi)大模型在中文數(shù)據(jù)上占有優(yōu)勢,但整體的中文數(shù)據(jù)在整個人類知識的數(shù)據(jù)體系中僅占很小一部分,中國大模型如何能夠真正做到跨語言體系、跨文化體系,構建起高價值、高質(zhì)量、全方位的數(shù)據(jù)集,仍然面臨較大挑戰(zhàn)。

視覺中國創(chuàng)始人、總裁柴繼軍表示,AIGC 將會對傳統(tǒng)的版權生態(tài)形成極大挑戰(zhàn)。在他看來,人類創(chuàng)作與機器創(chuàng)作能否真正做到人機協(xié)同尚無明確答案,如何更好地保護版權,讓內(nèi)容源頭的創(chuàng)作者分享人工智能再創(chuàng)作的價值,也仍然充滿挑戰(zhàn)。

商湯科技數(shù)字文娛總經(jīng)理欒青指出,當前市場對于大模型的未來發(fā)展及應用暫時處在探索階段,需要各方力量共同努力。作為發(fā)展大模型公司之一的商湯科技,她表示,鳳凰衛(wèi)視此次推出的數(shù)據(jù)平臺令人振奮,期望行業(yè)中有更多的媒體、企業(yè)能參與其中,推出更多具備結構化、更豐富的數(shù)據(jù)資源。

中科聞歌創(chuàng)始合伙人兼 CTO 曹家認為,我們需要正視本土大模型與國外以 OpenAI 為首的大模型產(chǎn)品的差距,但本土大模型在中文能力仍具有一定優(yōu)勢。他表示,大模型的訓練數(shù)據(jù)首先規(guī)模要足夠大,其次需要平衡數(shù)據(jù)之間的內(nèi)容配比,同時要保證數(shù)據(jù)的高質(zhì)量,清洗掉數(shù)據(jù)中的冗余、劣質(zhì)信息。

鳳凰數(shù)據(jù):為AI時代中華文化傳播提供支撐

作為本次大模型數(shù)據(jù)研討沙龍的重磅環(huán)節(jié),鳳凰衛(wèi)視正式推出旗下面向AI時代的全新業(yè)務 ——“鳳凰智媒AI數(shù)據(jù)業(yè)務”,并發(fā)布首批 “中文訪談對話數(shù)據(jù)集” 和 “正向價值對齊數(shù)據(jù)集”。

鳳凰衛(wèi)視融媒體研發(fā)副總經(jīng)理馮偉表示,高質(zhì)量的數(shù)據(jù)語料庫是AI時代承載中華文化的新載體,鳳凰數(shù)據(jù)的核心目標是為AI時代的中華文化傳播奠定堅實基礎,讓AI與中華文化認知對齊更簡單。

其中,“中文訪談對話數(shù)據(jù)集” 基于鳳凰衛(wèi)視訪談類節(jié)目生成,規(guī)模達百萬輪次,連續(xù)對話的平均輪次超 30 輪次?!罢騼r值對齊數(shù)據(jù)集” 的構建則以權威學術團隊的研究成果為指導,由鳳凰衛(wèi)視專業(yè)內(nèi)容團隊人工撰寫而成,規(guī)模達十萬個問答對。

除上述兩個數(shù)據(jù)集外,鳳凰數(shù)據(jù)還有多個數(shù)據(jù)集正在加工生成中,包括面向財經(jīng)領域的評論數(shù)據(jù)集、面向視頻內(nèi)容理解領域的視頻問答數(shù)據(jù)集、面向數(shù)字人領域的談話動作數(shù)據(jù)集和語音合成數(shù)據(jù)集等。同時,鳳凰數(shù)據(jù)也在同相關數(shù)據(jù)伙伴共同構建具有高價值和稀缺性的高質(zhì)量數(shù)據(jù)集,包括華語圖文對數(shù)據(jù)集、華語書籍數(shù)據(jù)集和網(wǎng)絡流行語數(shù)據(jù)集。

除了高質(zhì)量數(shù)據(jù)集產(chǎn)品外,鳳凰數(shù)據(jù)還將推出以數(shù)據(jù)為中心的一站式AI訓練平臺,計劃于近期開放內(nèi)測。平臺將與高質(zhì)量數(shù)據(jù)集市實現(xiàn)互聯(lián)互通,確保數(shù)據(jù)在平臺內(nèi)的安全使用。平臺也將提供一系列以數(shù)據(jù)為中心的服務,包括豐富的數(shù)據(jù)處理工具、可視化模型訓練和微調(diào)套件、全面的數(shù)據(jù)和模型評估框架和多云異構的算力資源。

據(jù)悉,2024 年,鳳凰數(shù)據(jù)計劃分三批發(fā)布更多高質(zhì)量數(shù)據(jù)集,并正式上線AI訓練平臺。同時,鳳凰數(shù)據(jù)還將舉行 “Link + 科技峰會” 和 “AI數(shù)據(jù)挑戰(zhàn)賽” 等系列活動,連接各界,解決行業(yè)痛點,共同推進AI與華語文化的認知進程。

面向高校及科研院所,鳳凰衛(wèi)視發(fā)布了 “鳳凰智媒AI筑巢計劃”,提供部分數(shù)據(jù)集的免費授權,以助力學術研究和創(chuàng)新。

相關推薦
免責聲明
本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。 交易和投資涉及高風險,讀者在采取與本文內(nèi)容相關的任何行動之前,請務必進行充分的盡職調(diào)查。最終的決策應該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產(chǎn)生的任何金錢損失負任何責任。

熱門文章