日本久久精品一区,下面一进一出好爽视频,91porny九色蝌蚪

首頁 > AI資訊 > 最新資訊 > “曹植”大模型主攻寫報(bào)告，達(dá)觀數(shù)據(jù)董事長(zhǎng)：機(jī)會(huì)在垂直行業(yè)

“曹植”大模型主攻寫報(bào)告，達(dá)觀數(shù)據(jù)董事長(zhǎng)：機(jī)會(huì)在垂直行業(yè)

新火種 2023-10-28

·“曹植”大模型可完成多類型、復(fù)雜結(jié)構(gòu)的長(zhǎng)文本寫作，自動(dòng)起草多種類型的文檔，未來將實(shí)現(xiàn)多模態(tài)內(nèi)容生成，如長(zhǎng)文檔中的表格、圖表、圖片等。其展示的能力不是問答，而是寫材料，界面完全針對(duì)各項(xiàng)材料應(yīng)用場(chǎng)景來定制。

·云計(jì)算服務(wù)商優(yōu)刻得董事長(zhǎng)兼CEO季昕華認(rèn)為：“如果沒有一點(diǎn)泡沫，資本不進(jìn)來，那對(duì)行業(yè)并不好，泡沫可控的時(shí)候整體氛圍比較好。相對(duì)來說，整個(gè)行業(yè)都在競(jìng)爭(zhēng)，每個(gè)投資者都會(huì)評(píng)估投出的錢是不是有效，所以相對(duì)來說是良性的。”

達(dá)觀數(shù)據(jù)董事長(zhǎng)陳運(yùn)文在2023世界人工智能大會(huì)上演講。

“目前我們談?wù)摰亩际悄Ｐ捅旧恚ń衲甑氖澜缛斯ぶ悄艽髸?huì)，但我覺得明年、后年大家會(huì)開始談一談模型用在哪里、解決什么問題，是什么樣的產(chǎn)品形態(tài)等。”7月7日，達(dá)觀數(shù)據(jù)董事長(zhǎng)陳運(yùn)文在世界人工智能大會(huì)期間在接受澎湃科技（www.thepaper.cn）采訪時(shí)表示。

達(dá)觀數(shù)據(jù)于2015年成立于上海，是一家為企業(yè)提供各類場(chǎng)景智能文本機(jī)器人的國(guó)家高新技術(shù)企業(yè)，結(jié)合先進(jìn)的自然語言處理（NLP)、智能文檔處理（IDP）、光學(xué)字符識(shí)別（OCR）、機(jī)器人流程自動(dòng)化（RPA）、知識(shí)圖譜等技術(shù)，為大型企業(yè)和政府機(jī)構(gòu)提供文檔智能審閱、文檔智能寫作、知識(shí)搜索與問答、辦公流程自動(dòng)化等智能文本機(jī)器人產(chǎn)品。

7月7日，達(dá)觀數(shù)據(jù)在2023世界人工智能大會(huì)“AI生成與垂直大語言模型的無限魅力” 主題論壇上發(fā)布“曹植”大模型。據(jù)該公司介紹，“這是國(guó)內(nèi)首個(gè)垂直行業(yè)專用的自主可控的GPT大語言模型，可準(zhǔn)確完成多類型、復(fù)雜結(jié)構(gòu)的長(zhǎng)文本寫作，自動(dòng)起草多種類型的文檔，未來將實(shí)現(xiàn)多模態(tài)內(nèi)容生成，如長(zhǎng)文檔中的表格、圖表、圖片等。”

曹植長(zhǎng)文本寫作應(yīng)用。

陳運(yùn)文說，今天看到的大模型展示更多是一問一答的形式，而“未來如果大模型真正發(fā)揮作用，一定不會(huì)只是一問一答的形式。就像電出現(xiàn)后，1879年出現(xiàn)最多的是造電燈泡的公司，但是電能的應(yīng)用不止電燈泡一種形式。我們不做燈泡，我們要做洗衣機(jī)、做電冰箱，要去想象其他真正滿足應(yīng)用場(chǎng)景的產(chǎn)品形態(tài)。”陳運(yùn)文對(duì)記者說，“你可以注意到我們今天展示的‘曹植’的能力都不是問答，而是寫報(bào)告，它的界面是完全針對(duì)寫報(bào)告這種應(yīng)用場(chǎng)景來定制的。”

采用混合訓(xùn)練數(shù)據(jù)方案

“大家都知道，曹植七步成詩。他作為建安七子之一，寫作的最著名的篇章《洛神賦》就是古代文學(xué)作品里典型首屈一指的長(zhǎng)文本。”陳運(yùn)文在發(fā)布會(huì)上介紹道，“這也是‘曹植’大模型的專長(zhǎng)，做文檔資料智能化的分析寫作工作。”

“曹植”大模型采用混合訓(xùn)練數(shù)據(jù)的方案，即包括50%高質(zhì)量的各行各業(yè)混合語料和50%垂直專用語料。“采用混合的方式很好兼容了模型的通用基座能力和垂直行業(yè)的專業(yè)能力。”陳運(yùn)文說。

大語言模型本身有非常強(qiáng)大的語言理解能力，但同時(shí)也有自己的弊端，比如會(huì)產(chǎn)生“幻覺”，即“一本正經(jīng)地胡說八道”。而在專業(yè)領(lǐng)域，所有數(shù)據(jù)都必須非常嚴(yán)謹(jǐn)準(zhǔn)確。如何解決這個(gè)矛盾？

“我們一方面是把經(jīng)典的知識(shí)圖譜、業(yè)務(wù)引擎等和大語言模型融合。同時(shí)我們也發(fā)現(xiàn)，不同參數(shù)規(guī)模的模型各有利弊，所以我們的模型中既有數(shù)十億參數(shù)，也會(huì)有數(shù)百億參數(shù)，未來還會(huì)研發(fā)數(shù)千億參數(shù)的模型，甚至未來還可以對(duì)接其他第三方已有的大模型，讓各種模型融會(huì)貫通，各取所長(zhǎng)。”陳運(yùn)文說。

如果讓一個(gè)大模型真正能夠處理長(zhǎng)文本，它需要聰明地應(yīng)對(duì)多模態(tài)的內(nèi)容，同時(shí)能夠?qū)?fù)雜的結(jié)構(gòu)元素進(jìn)行理解和分析。比如分析證券領(lǐng)域的研報(bào)，需要讓計(jì)算機(jī)像人一樣了解，每個(gè)版面的區(qū)域是什么含義，板塊如何分布，然后才能用大模型的語義理解做進(jìn)一步的閱讀理解工作，除此之外，還要解析沒有邊框或是有各種復(fù)雜嵌套的表格等，在現(xiàn)實(shí)應(yīng)用中，對(duì)各種各樣的文檔資料進(jìn)行理解與分析是其中難點(diǎn)。

“以前大家看到的很多大模型應(yīng)用中，它不考慮這么多復(fù)雜的模態(tài)。而真正要投入使用時(shí)會(huì)發(fā)現(xiàn)，這些模態(tài)、格式多樣，如果不解決這個(gè)問題是沒有辦法真正投入使用的。”陳運(yùn)文說，“我相信在各種大模型的發(fā)布會(huì)上大家可能第一次聽說這些技術(shù)，但我覺得這些技術(shù)才能真正讓大模型發(fā)揮生產(chǎn)力去解決問題。”

“垂直大模型能解決輸出不可控問題”

“未來大模型真正得以運(yùn)用，還是需要和每一個(gè)垂直行業(yè)深度結(jié)合，去解決每一個(gè)行業(yè)里面真正的痛點(diǎn)才行。”陳運(yùn)文認(rèn)為，“大模型未來在企業(yè)的落地形態(tài)一定是大模型和多個(gè)企業(yè)垂直小模型的組合，真正的機(jī)會(huì)在垂直行業(yè)市場(chǎng)落地。”

在“AI生成與垂直大語言模型的無限魅力”論壇中，云計(jì)算服務(wù)商優(yōu)刻得董事長(zhǎng)季昕華對(duì)澎湃科技介紹了其對(duì)國(guó)內(nèi)大模型數(shù)量的統(tǒng)計(jì)：目前國(guó)內(nèi)有130家公司在做大模型，其中做通用大模型的有78家，做垂直大模型的有52家。

“我認(rèn)為未來的趨勢(shì)是垂直大模型會(huì)越來越多。通用的好處是什么都知道，但是不深，垂直則能解決輸出不可控的問題，未來可能是通用加垂直一起來解決問題，而垂直由于它對(duì)數(shù)據(jù)和產(chǎn)品要求會(huì)更高，所以作用會(huì)更強(qiáng)一些。”季昕華說。

今年3月底，彭博社（Bloomberg）發(fā)布金融版ChatGPT“BloombergGPT”。“他們用非常好的訓(xùn)練方式訓(xùn)練出金融領(lǐng)域?qū)Ｓ玫拇笳Z言模型，我覺得做了一個(gè)非常好的示范。”陳運(yùn)文說。

“百模大戰(zhàn)”是不是泡沫？“卡布奇諾最好”

“從歷史發(fā)展來看，實(shí)際上除了百模大戰(zhàn)之外，曾經(jīng)有互聯(lián)網(wǎng)的‘百團(tuán)大戰(zhàn)’甚至‘千團(tuán)大戰(zhàn)’。只是整個(gè)模型訓(xùn)練需要比較高的門檻，所以目前才只是出現(xiàn)了100多家，如果沒有這么高的門檻，估計(jì)有1000家在做，這說明大家對(duì)整個(gè)行業(yè)的預(yù)期很好。”季昕華說。

隨著ChatGPT用戶增速放緩，質(zhì)疑這次生成式AI熱潮是不是泡沫的聲音也開始出現(xiàn)。對(duì)于記者的相關(guān)提問，季昕華有些出乎意料地答道，“我喝咖啡特別喜歡卡布奇諾”。

他接著說，“因?yàn)樗蟛糠质强Х龋厦嬗幸稽c(diǎn)點(diǎn)泡沫，這種味道是比較好的。整個(gè)行業(yè)發(fā)展也是一樣，如果沒有一點(diǎn)泡沫，資本不進(jìn)來，那對(duì)行業(yè)并不好，泡沫可控的時(shí)候整體氛圍比較好。相對(duì)來說，整個(gè)行業(yè)都在競(jìng)爭(zhēng)，每個(gè)投資者都會(huì)評(píng)估投出的錢是不是有效，所以相對(duì)來說是良性的。”

陳運(yùn)文也認(rèn)為百模大戰(zhàn)是很合理的狀態(tài)，“因?yàn)樾碌臇|西出來一定需要有很多人響應(yīng)，這也證明了大模型確實(shí)是非常有價(jià)值的東西。”

根據(jù)季昕華的判斷，目前國(guó)內(nèi)大模型整體情況比OpenAI的GPT-3.5略微低一些，大概今年年底能達(dá)到GPT-3.5的水平，明年能達(dá)到GPT-4的水平。“目前來講，整個(gè)大模型的核心問題在于：第一，是否有足夠的數(shù)據(jù)；第二，是否有足夠的算力；第三，非常關(guān)鍵的是算法；第四，能否實(shí)現(xiàn)線上的閉環(huán)，形成閉環(huán)反饋對(duì)大模型的優(yōu)化非常有幫助。”

接下來，在“百模大戰(zhàn)”之后，陳運(yùn)文認(rèn)為就會(huì)是開始落地的時(shí)候，“這個(gè)我們稱為先打雷再下雨，目前是大家都知道大模型，但其實(shí)在很多工作崗位上還沒有怎么用上。接下來需要讓這些模型的能力在千行百業(yè)落地應(yīng)用，滲透進(jìn)去賦能行業(yè)。”

Tags:

自然語言處理達(dá)觀董事長(zhǎng)

相關(guān)推薦

免責(zé)聲明: 本文所包含的觀點(diǎn)僅代表作者個(gè)人看法，不代表新火種的觀點(diǎn)。在新火種上獲取的所有信息均不應(yīng)被視為投資建議。新火種對(duì)本文可能提及或鏈接的任何項(xiàng)目不表示認(rèn)可。交易和投資涉及高風(fēng)險(xiǎn)，讀者在采取與本文內(nèi)容相關(guān)的任何行動(dòng)之前，請(qǐng)務(wù)必進(jìn)行充分的盡職調(diào)查。最終的決策應(yīng)該基于您自己的獨(dú)立判斷。新火種不對(duì)因依賴本文觀點(diǎn)而產(chǎn)生的任何金錢損失負(fù)任何責(zé)任。

“曹植”大模型主攻寫報(bào)告，達(dá)觀數(shù)據(jù)董事長(zhǎng)：機(jī)會(huì)在垂直行業(yè)

中金公司董事長(zhǎng)陳亮：2024-2030年間中國(guó)在AI產(chǎn)業(yè)的總投資規(guī)模將超過10萬億元

中金公司董事長(zhǎng)陳亮：2024

北京市委書記尹力會(huì)見新加坡淡馬錫公司董事長(zhǎng)

中國(guó)電子董事長(zhǎng)曾毅：不要將人工智能應(yīng)用過度娛樂化

奇安信董事長(zhǎng)齊向東：算力價(jià)格不斷上漲不利于大模型或AI發(fā)展

熱門文章