首頁(yè) > AI資訊 > 最新資訊 > 聚焦文檔圖像處理前沿領(lǐng)域合合信息AI助力圖像處理與內(nèi)容安全保障

聚焦文檔圖像處理前沿領(lǐng)域合合信息AI助力圖像處理與內(nèi)容安全保障

新火種    2023-09-24

  近日,2023第十二屆中國(guó)智能產(chǎn)業(yè)高峰論壇(CIIS2023)在江西南昌順利舉行。本次大會(huì)重點(diǎn)關(guān)注AI大模型、生成式AI、無(wú)人系統(tǒng)、智能制造、數(shù)字安全等領(lǐng)域,匯集了來(lái)自中國(guó)工程院、國(guó)際歐亞科學(xué)院、國(guó)際核能院等多個(gè)學(xué)術(shù)機(jī)構(gòu)的院士進(jìn)行主題報(bào)告演講、專(zhuān)題論壇研討。

  行業(yè)的發(fā)展離不開(kāi)信息傳遞,文檔是信息傳遞最常見(jiàn)的載體之一。智能文檔處理技術(shù)歷來(lái)便是學(xué)術(shù)界重點(diǎn)關(guān)注的領(lǐng)域,多模態(tài)大模型可以利用大量的數(shù)據(jù)進(jìn)行預(yù)訓(xùn)練,有效解決文檔圖像質(zhì)量及自然語(yǔ)言處理技術(shù)限制問(wèn)題。基于此,大會(huì)期間,中國(guó)人工智能學(xué)會(huì)(CAI)模式識(shí)別專(zhuān)委會(huì)與合合信息共同承辦了《多模態(tài)大模型與文檔圖像智能理解》專(zhuān)題論壇,論壇主席為華南理工大學(xué)金連文教授、復(fù)旦大學(xué)邱錫鵬教授。來(lái)自清華大學(xué)、華中科技大學(xué)、復(fù)旦大學(xué)、百度、科大訊飛、合合信息等研究機(jī)構(gòu)和企業(yè)的技術(shù)專(zhuān)家,圍繞行業(yè)焦點(diǎn)議題展開(kāi)探討。

  “大模型的出現(xiàn)勢(shì)必對(duì)行業(yè)帶來(lái)巨大的影響,文檔圖像的分析、識(shí)別、理解與大模型技術(shù)間存在互補(bǔ)關(guān)系。”合合信息智能技術(shù)平臺(tái)事業(yè)部副總經(jīng)理、高級(jí)工程師丁凱博士在《文檔圖像預(yù)訓(xùn)練模型的探索與思考》分享中提到,在互聯(lián)網(wǎng)語(yǔ)料“見(jiàn)底”之日逐漸逼近之時(shí),電子書(shū)成為了大模型訓(xùn)練的新“燃料”,而電子書(shū)很多是由文檔圖像組成的,文檔圖像識(shí)別分析與智能理解技術(shù)可以將大量的文檔圖像轉(zhuǎn)化為具有豐富格式信息的文本,為大模型提供更豐富更高質(zhì)量的訓(xùn)練語(yǔ)料,解決大模型訓(xùn)練的‘token荒’的問(wèn)題。

  文檔圖像技術(shù)已走過(guò)百年歷程,但文檔圖像質(zhì)量退化、文字檢測(cè)及版面分析困難、非限定條件文字識(shí)別率低、結(jié)構(gòu)化智能理解能力差等問(wèn)題如今仍是工業(yè)化落地中的難題。丁凱認(rèn)為,文檔圖像處理技術(shù)在推動(dòng)大模型技術(shù)發(fā)展的同時(shí),大模型的小樣本學(xué)習(xí)能力、多任務(wù)能力、智能涌現(xiàn)能力對(duì)于文檔圖像處理問(wèn)題的解決具有重要的研究?jī)r(jià)值。

  “在已有的學(xué)術(shù)研究中,文檔圖像專(zhuān)有大模型在更復(fù)雜的文檔理解問(wèn)題上存在天然的短板,而一些多模態(tài)大模型已經(jīng)表現(xiàn)出了從含有表格、圖片等多重元素的文檔中提取關(guān)鍵信息進(jìn)行分析,理解內(nèi)容的潛力。”丁凱表示,研究人員可以基于現(xiàn)有的領(lǐng)域做更好的融合,開(kāi)辟新的研究方向。

  合合信息-華南理工大學(xué)文檔圖像分析識(shí)別與理解聯(lián)合實(shí)驗(yàn)室也對(duì)以下行業(yè)前沿問(wèn)題進(jìn)行了研究,包括如何將文檔圖像識(shí)別分析的各種任務(wù)定義為序列預(yù)測(cè)的形式,通過(guò)不同的AI提示詞(prompt)引導(dǎo)模型完成不同的文檔圖像識(shí)別分析與理解任務(wù),讓模型更好地支持篇章級(jí)的文檔圖像識(shí)別分析。

(文章來(lái)源:證券日?qǐng)?bào))

相關(guān)推薦
免責(zé)聲明
本文所包含的觀點(diǎn)僅代表作者個(gè)人看法,不代表新火種的觀點(diǎn)。在新火種上獲取的所有信息均不應(yīng)被視為投資建議。新火種對(duì)本文可能提及或鏈接的任何項(xiàng)目不表示認(rèn)可。 交易和投資涉及高風(fēng)險(xiǎn),讀者在采取與本文內(nèi)容相關(guān)的任何行動(dòng)之前,請(qǐng)務(wù)必進(jìn)行充分的盡職調(diào)查。最終的決策應(yīng)該基于您自己的獨(dú)立判斷。新火種不對(duì)因依賴本文觀點(diǎn)而產(chǎn)生的任何金錢(qián)損失負(fù)任何責(zé)任。

熱門(mén)文章