首頁 > AI資訊 > 最新資訊 > “曹植”大模型主攻寫報(bào)告,達(dá)觀數(shù)據(jù)董事長(zhǎng):機(jī)會(huì)在垂直行業(yè)

“曹植”大模型主攻寫報(bào)告,達(dá)觀數(shù)據(jù)董事長(zhǎng):機(jī)會(huì)在垂直行業(yè)

新火種    2023-10-28

·“曹植”大模型可完成多類型、復(fù)雜結(jié)構(gòu)的長(zhǎng)文本寫作,自動(dòng)起草多種類型的文檔,未來將實(shí)現(xiàn)多模態(tài)內(nèi)容生成,如長(zhǎng)文檔中的表格、圖表、圖片等。其展示的能力不是問答,而是寫材料,界面完全針對(duì)各項(xiàng)材料應(yīng)用場(chǎng)景來定制。

·云計(jì)算服務(wù)商優(yōu)刻得董事長(zhǎng)兼CEO季昕華認(rèn)為:“如果沒有一點(diǎn)泡沫,資本不進(jìn)來,那對(duì)行業(yè)并不好,泡沫可控的時(shí)候整體氛圍比較好。相對(duì)來說,整個(gè)行業(yè)都在競(jìng)爭(zhēng),每個(gè)投資者都會(huì)評(píng)估投出的錢是不是有效,所以相對(duì)來說是良性的。”

達(dá)觀數(shù)據(jù)董事長(zhǎng)陳運(yùn)文在2023世界人工智能大會(huì)上演講。

“目前我們談?wù)摰亩际悄P捅旧恚ń衲甑氖澜缛斯ぶ悄艽髸?huì),但我覺得明年、后年大家會(huì)開始談一談模型用在哪里、解決什么問題,是什么樣的產(chǎn)品形態(tài)等。”7月7日,達(dá)觀數(shù)據(jù)董事長(zhǎng)陳運(yùn)文在世界人工智能大會(huì)期間在接受澎湃科技(www.thepaper.cn)采訪時(shí)表示。

達(dá)觀數(shù)據(jù)于2015年成立于上海,是一家為企業(yè)提供各類場(chǎng)景智能文本機(jī)器人的國(guó)家高新技術(shù)企業(yè),結(jié)合先進(jìn)的自然語言處理(NLP)、智能文檔處理(IDP)、光學(xué)字符識(shí)別(OCR)、機(jī)器人流程自動(dòng)化(RPA)、知識(shí)圖譜等技術(shù),為大型企業(yè)和政府機(jī)構(gòu)提供文檔智能審閱、文檔智能寫作、知識(shí)搜索與問答、辦公流程自動(dòng)化等智能文本機(jī)器人產(chǎn)品。

7月7日,達(dá)觀數(shù)據(jù)在2023世界人工智能大會(huì)“AI生成與垂直大語言模型的無限魅力” 主題論壇上發(fā)布“曹植”大模型。據(jù)該公司介紹,“這是國(guó)內(nèi)首個(gè)垂直行業(yè)專用的自主可控的GPT大語言模型,可準(zhǔn)確完成多類型、復(fù)雜結(jié)構(gòu)的長(zhǎng)文本寫作,自動(dòng)起草多種類型的文檔,未來將實(shí)現(xiàn)多模態(tài)內(nèi)容生成,如長(zhǎng)文檔中的表格、圖表、圖片等。”

曹植長(zhǎng)文本寫作應(yīng)用。

陳運(yùn)文說,今天看到的大模型展示更多是一問一答的形式,而“未來如果大模型真正發(fā)揮作用,一定不會(huì)只是一問一答的形式。就像電出現(xiàn)后,1879年出現(xiàn)最多的是造電燈泡的公司,但是電能的應(yīng)用不止電燈泡一種形式。我們不做燈泡,我們要做洗衣機(jī)、做電冰箱,要去想象其他真正滿足應(yīng)用場(chǎng)景的產(chǎn)品形態(tài)。”陳運(yùn)文對(duì)記者說,“你可以注意到我們今天展示的‘曹植’的能力都不是問答,而是寫報(bào)告,它的界面是完全針對(duì)寫報(bào)告這種應(yīng)用場(chǎng)景來定制的。”

采用混合訓(xùn)練數(shù)據(jù)方案

“大家都知道,曹植七步成詩。他作為建安七子之一,寫作的最著名的篇章《洛神賦》就是古代文學(xué)作品里典型首屈一指的長(zhǎng)文本。”陳運(yùn)文在發(fā)布會(huì)上介紹道,“這也是‘曹植’大模型的專長(zhǎng),做文檔資料智能化的分析寫作工作。”

“曹植”大模型采用混合訓(xùn)練數(shù)據(jù)的方案,即包括50%高質(zhì)量的各行各業(yè)混合語料和50%垂直專用語料。“采用混合的方式很好兼容了模型的通用基座能力和垂直行業(yè)的專業(yè)能力。”陳運(yùn)文說。

大語言模型本身有非常強(qiáng)大的語言理解能力,但同時(shí)也有自己的弊端,比如會(huì)產(chǎn)生“幻覺”,即“一本正經(jīng)地胡說八道”。而在專業(yè)領(lǐng)域,所有數(shù)據(jù)都必須非常嚴(yán)謹(jǐn)準(zhǔn)確。如何解決這個(gè)矛盾?

“我們一方面是把經(jīng)典的知識(shí)圖譜、業(yè)務(wù)引擎等和大語言模型融合。同時(shí)我們也發(fā)現(xiàn),不同參數(shù)規(guī)模的模型各有利弊,所以我們的模型中既有數(shù)十億參數(shù),也會(huì)有數(shù)百億參數(shù),未來還會(huì)研發(fā)數(shù)千億參數(shù)的模型,甚至未來還可以對(duì)接其他第三方已有的大模型,讓各種模型融會(huì)貫通,各取所長(zhǎng)。”陳運(yùn)文說。

如果讓一個(gè)大模型真正能夠處理長(zhǎng)文本,它需要聰明地應(yīng)對(duì)多模態(tài)的內(nèi)容,同時(shí)能夠?qū)?fù)雜的結(jié)構(gòu)元素進(jìn)行理解和分析。比如分析證券領(lǐng)域的研報(bào),需要讓計(jì)算機(jī)像人一樣了解,每個(gè)版面的區(qū)域是什么含義,板塊如何分布,然后才能用大模型的語義理解做進(jìn)一步的閱讀理解工作,除此之外,還要解析沒有邊框或是有各種復(fù)雜嵌套的表格等,在現(xiàn)實(shí)應(yīng)用中,對(duì)各種各樣的文檔資料進(jìn)行理解與分析是其中難點(diǎn)。

“以前大家看到的很多大模型應(yīng)用中,它不考慮這么多復(fù)雜的模態(tài)。而真正要投入使用時(shí)會(huì)發(fā)現(xiàn),這些模態(tài)、格式多樣,如果不解決這個(gè)問題是沒有辦法真正投入使用的。”陳運(yùn)文說,“我相信在各種大模型的發(fā)布會(huì)上大家可能第一次聽說這些技術(shù),但我覺得這些技術(shù)才能真正讓大模型發(fā)揮生產(chǎn)力去解決問題。”

“垂直大模型能解決輸出不可控問題”

“未來大模型真正得以運(yùn)用,還是需要和每一個(gè)垂直行業(yè)深度結(jié)合,去解決每一個(gè)行業(yè)里面真正的痛點(diǎn)才行。”陳運(yùn)文認(rèn)為,“大模型未來在企業(yè)的落地形態(tài)一定是大模型和多個(gè)企業(yè)垂直小模型的組合,真正的機(jī)會(huì)在垂直行業(yè)市場(chǎng)落地。”

在“AI生成與垂直大語言模型的無限魅力”論壇中,云計(jì)算服務(wù)商優(yōu)刻得董事長(zhǎng)季昕華對(duì)澎湃科技介紹了其對(duì)國(guó)內(nèi)大模型數(shù)量的統(tǒng)計(jì):目前國(guó)內(nèi)有130家公司在做大模型,其中做通用大模型的有78家,做垂直大模型的有52家。

“我認(rèn)為未來的趨勢(shì)是垂直大模型會(huì)越來越多。通用的好處是什么都知道,但是不深,垂直則能解決輸出不可控的問題,未來可能是通用加垂直一起來解決問題,而垂直由于它對(duì)數(shù)據(jù)和產(chǎn)品要求會(huì)更高,所以作用會(huì)更強(qiáng)一些。”季昕華說。

今年3月底,彭博社(Bloomberg)發(fā)布金融版ChatGPT“BloombergGPT”。“他們用非常好的訓(xùn)練方式訓(xùn)練出金融領(lǐng)域?qū)S玫拇笳Z言模型,我覺得做了一個(gè)非常好的示范。”陳運(yùn)文說。

“百模大戰(zhàn)”是不是泡沫?“卡布奇諾最好”

“從歷史發(fā)展來看,實(shí)際上除了百模大戰(zhàn)之外,曾經(jīng)有互聯(lián)網(wǎng)的‘百團(tuán)大戰(zhàn)’甚至‘千團(tuán)大戰(zhàn)’。只是整個(gè)模型訓(xùn)練需要比較高的門檻,所以目前才只是出現(xiàn)了100多家,如果沒有這么高的門檻,估計(jì)有1000家在做,這說明大家對(duì)整個(gè)行業(yè)的預(yù)期很好。”季昕華說。

隨著ChatGPT用戶增速放緩,質(zhì)疑這次生成式AI熱潮是不是泡沫的聲音也開始出現(xiàn)。對(duì)于記者的相關(guān)提問,季昕華有些出乎意料地答道,“我喝咖啡特別喜歡卡布奇諾”。

他接著說,“因?yàn)樗蟛糠质强Х龋厦嬗幸稽c(diǎn)點(diǎn)泡沫,這種味道是比較好的。整個(gè)行業(yè)發(fā)展也是一樣,如果沒有一點(diǎn)泡沫,資本不進(jìn)來,那對(duì)行業(yè)并不好,泡沫可控的時(shí)候整體氛圍比較好。相對(duì)來說,整個(gè)行業(yè)都在競(jìng)爭(zhēng),每個(gè)投資者都會(huì)評(píng)估投出的錢是不是有效,所以相對(duì)來說是良性的。”

陳運(yùn)文也認(rèn)為百模大戰(zhàn)是很合理的狀態(tài),“因?yàn)樾碌臇|西出來一定需要有很多人響應(yīng),這也證明了大模型確實(shí)是非常有價(jià)值的東西。”

根據(jù)季昕華的判斷,目前國(guó)內(nèi)大模型整體情況比OpenAI的GPT-3.5略微低一些,大概今年年底能達(dá)到GPT-3.5的水平,明年能達(dá)到GPT-4的水平。“目前來講,整個(gè)大模型的核心問題在于:第一,是否有足夠的數(shù)據(jù);第二,是否有足夠的算力;第三,非常關(guān)鍵的是算法;第四,能否實(shí)現(xiàn)線上的閉環(huán),形成閉環(huán)反饋對(duì)大模型的優(yōu)化非常有幫助。”

接下來,在“百模大戰(zhàn)”之后,陳運(yùn)文認(rèn)為就會(huì)是開始落地的時(shí)候,“這個(gè)我們稱為先打雷再下雨,目前是大家都知道大模型,但其實(shí)在很多工作崗位上還沒有怎么用上。接下來需要讓這些模型的能力在千行百業(yè)落地應(yīng)用,滲透進(jìn)去賦能行業(yè)。”

相關(guān)推薦
免責(zé)聲明
本文所包含的觀點(diǎn)僅代表作者個(gè)人看法,不代表新火種的觀點(diǎn)。在新火種上獲取的所有信息均不應(yīng)被視為投資建議。新火種對(duì)本文可能提及或鏈接的任何項(xiàng)目不表示認(rèn)可。 交易和投資涉及高風(fēng)險(xiǎn),讀者在采取與本文內(nèi)容相關(guān)的任何行動(dòng)之前,請(qǐng)務(wù)必進(jìn)行充分的盡職調(diào)查。最終的決策應(yīng)該基于您自己的獨(dú)立判斷。新火種不對(duì)因依賴本文觀點(diǎn)而產(chǎn)生的任何金錢損失負(fù)任何責(zé)任。

熱門文章