騰訊與福佑卡車聯(lián)手!打造首個(gè)數(shù)字貨運(yùn)大模型,OCR識(shí)別準(zhǔn)確率提升超20%
作者 | 程茜
編輯 | 心緣
智東西10月25日?qǐng)?bào)道,本周一,騰訊與福佑卡車宣布將聯(lián)合打造行業(yè)首個(gè)數(shù)字貨運(yùn)大模型。
目前,騰訊與福佑卡車從智能化OCR物流證件識(shí)別方向切入,目前已形成了端到端的OCR智能識(shí)別大模型能力,并針對(duì)物流證件識(shí)別、各類回單識(shí)別等場(chǎng)景實(shí)現(xiàn)了智能識(shí)別與自動(dòng)處理,基于大模型OCR準(zhǔn)確率相比福佑卡車傳統(tǒng)模型提升20%以上。
下一步,騰訊與福佑卡車將在智能客服外呼、智能分析、智能分單系統(tǒng)等場(chǎng)景逐步展開合作。
福佑卡車技術(shù)合伙人陳冠嶺告訴智東西,從福佑卡車內(nèi)部來(lái)講,現(xiàn)在的階段智能客服是優(yōu)先智能數(shù)據(jù)分析,因?yàn)閭鹘y(tǒng)的智能客服需要維護(hù)數(shù)據(jù)庫(kù)、標(biāo)準(zhǔn)答案,但其實(shí)由于公司業(yè)務(wù)變化很快,維護(hù)成本很高,他們希望能看大模型能不能做到端到端的智能客服的解決方案,降低維護(hù)成本。他希望明年Q1、Q2具體的東西能跑起來(lái),真實(shí)檢驗(yàn)一下智能客服的效果。
他補(bǔ)充說(shuō),相比于智能客服,大模型應(yīng)用于智能分析領(lǐng)域的挑戰(zhàn)會(huì)更大。原因在于這一領(lǐng)域?qū)?shù)據(jù)的要求更高。因此,福佑卡車要根據(jù)具體方案才能決定內(nèi)部上線產(chǎn)品節(jié)奏,他們希望下半年看到一些場(chǎng)景應(yīng)用。
一、OCR準(zhǔn)確率總體提升超20%,復(fù)雜三方打卡圖識(shí)別率達(dá)95%
福佑卡車通過全鏈路數(shù)字化推動(dòng)其業(yè)務(wù)降本增效已經(jīng)有一定成果,貨運(yùn)準(zhǔn)時(shí)率達(dá)到95.2%,貨運(yùn)服務(wù)事故率降至0.02%,車輛空駛率由行業(yè)平均值45%下降到6.6%,車輛空置率由行業(yè)平均值40%下降到24.8%,司機(jī)收入提高33%。
基于大模型技術(shù),福佑卡車聯(lián)合騰訊將實(shí)現(xiàn)物流貨運(yùn)行業(yè)的數(shù)字化智能化創(chuàng)新,從而實(shí)現(xiàn)運(yùn)營(yíng)效率和客戶體驗(yàn)的全面提升。貨運(yùn)領(lǐng)域應(yīng)用AI的門檻將會(huì)被降低,數(shù)字貨運(yùn)將進(jìn)一步提升為智能貨運(yùn)。
騰訊智慧交流積累了物流行業(yè)解決方案的經(jīng)驗(yàn),今年6月,騰訊云發(fā)布行業(yè)大模型解決方案,通過騰訊云TI平臺(tái)提供MaaS一站式服務(wù);福佑卡車作為貨運(yùn)場(chǎng)景方,積累了大量的行業(yè)數(shù)據(jù),深切知道行業(yè)痛點(diǎn)是什么。
因此,福佑卡車和騰訊將智能化OCR物流證件識(shí)別作為切入點(diǎn),進(jìn)一步延續(xù)到貨運(yùn)領(lǐng)域的關(guān)鍵崗位上,可能打造智能助手提升工作的效率,最后探索對(duì)整個(gè)行業(yè)進(jìn)行賦能,實(shí)現(xiàn)上下游拓展。
第一階段,福佑卡車和騰訊的智能化OCR物流證件識(shí)別已經(jīng)落地,基于大模型OCR準(zhǔn)確率相比傳統(tǒng)模型提升20%以上。其中,圖片信息匹配綜合識(shí)別準(zhǔn)確率達(dá)到95%以上、圖片字段識(shí)別準(zhǔn)確率達(dá)到99%,圖片字段識(shí)別召回率為98%。
主要提升在于工程化提效,福佑卡車新增需要識(shí)別的證件圖片時(shí),只需要小樣本量的訓(xùn)練機(jī)就可以達(dá)到傳統(tǒng)OCR數(shù)千樣本量以上的訓(xùn)練效果。
準(zhǔn)確率也有所提升,物流貨運(yùn)行業(yè)特有的復(fù)雜三方打卡圖片識(shí)別,準(zhǔn)確率從90%提升到了95%以上。
自動(dòng)化程度提升,省略了人工驗(yàn)證環(huán)節(jié),基于智能化檢測(cè)驗(yàn)證,能進(jìn)一步降低人工成本。
下一步,騰訊和福佑卡車將在智能客服外呼、智能分析、智能分單系統(tǒng)方面進(jìn)行深入合作和拓展。
二、基于高質(zhì)量垂直語(yǔ)料,打造OCR、智能客服大模型
AI進(jìn)入大模型時(shí)代,泛化性、通用性、實(shí)用性大大增強(qiáng)。
物流行業(yè)中企業(yè)積累了大量的場(chǎng)景化數(shù)據(jù),依托于騰訊行業(yè)大模型方案在技術(shù)、平臺(tái)、應(yīng)用層面的構(gòu)建能滿足福佑卡車這類行業(yè)用戶的場(chǎng)景化訴求。
傳統(tǒng)OCR模型往往基于小模型做,識(shí)別過程包括檢測(cè)、識(shí)別文字內(nèi)容,智能結(jié)構(gòu)化提取,然后通過小模型做堆積,每個(gè)環(huán)節(jié)都有一定折損,會(huì)導(dǎo)致OCR效果不佳。
并且其不具備閱讀理解和推理能力,模型的復(fù)用性也不強(qiáng)。
騰訊OCR大模型可以做到端對(duì)端識(shí)別,整個(gè)模型的效果會(huì)比傳統(tǒng)OCR模型有提升,即使企業(yè)不做精調(diào),也能達(dá)到更好效果,還能實(shí)現(xiàn)單模型多任務(wù)處理,具備一定的閱讀理解和推理能力。
這一大模型基于原生大模型,不經(jīng)過訓(xùn)練可以直接支持常規(guī)下游任務(wù),Zero–shot學(xué)習(xí)泛化字段召回率可達(dá)93%以上;企業(yè)落地時(shí)通過Prompt設(shè)計(jì),可以不經(jīng)過訓(xùn)練支持復(fù)雜的下游任務(wù),F(xiàn)ew-shot泛化字段召回率可達(dá)到95%以上;騰訊OCR大模型通過多模態(tài)技術(shù),通過小樣本精調(diào)解決傳統(tǒng)OCR難題,比傳統(tǒng)模型召回率提高3%-20%。
為了企業(yè)實(shí)現(xiàn)更低成本的落地,騰訊OCR大模型功能設(shè)計(jì)采用數(shù)據(jù)分組、字段描述子、標(biāo)注檢查、Badcase智能分析等。
并且,騰訊內(nèi)部在TI-OCR上進(jìn)行日常標(biāo)注和建模,平均一個(gè)季度完成70000次標(biāo)注任務(wù),完成超100次模型訓(xùn)練任務(wù)。
OCR大模型精調(diào)能使其基于特定場(chǎng)景感知文字信息,核心的提升點(diǎn)在于訓(xùn)練樣本更少、訓(xùn)練時(shí)長(zhǎng)更高,對(duì)于復(fù)雜的場(chǎng)景和訓(xùn)練,迭代一個(gè)模型的時(shí)長(zhǎng)在小時(shí)、分鐘級(jí)。
對(duì)于物流行業(yè)的智能客服,其痛點(diǎn)在于對(duì)話效果不夠智能、人工坐席服務(wù)效率不高、傳統(tǒng)知識(shí)庫(kù)整理及運(yùn)營(yíng)依賴人工,投入大、效率低。
因此,底層基于物流行業(yè)客服大模型,加上福佑卡車內(nèi)部數(shù)據(jù)進(jìn)行精調(diào),智能客服的能力升級(jí)。
大模型在泛化性、理解性方面的能力提升,能解決復(fù)雜問題,并且基于知識(shí)庫(kù)文檔快速學(xué)習(xí),知識(shí)點(diǎn)快速提煉,掌握知識(shí)的時(shí)間從月級(jí)升級(jí)到分鐘級(jí)。
騰訊客服大模型能實(shí)現(xiàn)低成本訓(xùn)練和推理,將百億大模型訓(xùn)練成本從64卡降低到8卡,千億大模型從從128卡降到了32卡。并且,智能客服還能通過搜索引擎獲取網(wǎng)絡(luò)知識(shí),提高回答的多樣性和相關(guān)性。
大模型能建立實(shí)時(shí)更新的大模型向量數(shù)據(jù)庫(kù),將閱讀理解的長(zhǎng)度從2k提升到8k,上下文挖掘觀點(diǎn)的能力也有大幅提升。
除了知識(shí)問答外,智能客服還需要完成任務(wù)型辦理,如查訂單、狀態(tài)獲取等,基于客服大模型就可以通過API調(diào)用完成任務(wù)構(gòu)建。
結(jié)語(yǔ):生成式AI席卷貨運(yùn)物流全鏈路變革
陳冠嶺談道,目前我國(guó)公路貨運(yùn)行業(yè)市場(chǎng)規(guī)模達(dá)到了5萬(wàn)億元,但數(shù)字貨運(yùn)滲透率只有15%,市場(chǎng)規(guī)模為7000億元。物流貨運(yùn)具有體系完善、環(huán)節(jié)眾多、數(shù)據(jù)復(fù)雜、場(chǎng)景豐富等特性,一直以來(lái)都是前沿技術(shù)落地應(yīng)用的重要領(lǐng)域。
大模型技術(shù)正在席卷各行各業(yè),同樣將為貨運(yùn)物流全鏈路運(yùn)營(yíng)效率、服務(wù)體驗(yàn)和業(yè)務(wù)創(chuàng)新帶來(lái)巨大變革。
- 免責(zé)聲明
- 本文所包含的觀點(diǎn)僅代表作者個(gè)人看法,不代表新火種的觀點(diǎn)。在新火種上獲取的所有信息均不應(yīng)被視為投資建議。新火種對(duì)本文可能提及或鏈接的任何項(xiàng)目不表示認(rèn)可。 交易和投資涉及高風(fēng)險(xiǎn),讀者在采取與本文內(nèi)容相關(guān)的任何行動(dòng)之前,請(qǐng)務(wù)必進(jìn)行充分的盡職調(diào)查。最終的決策應(yīng)該基于您自己的獨(dú)立判斷。新火種不對(duì)因依賴本文觀點(diǎn)而產(chǎn)生的任何金錢損失負(fù)任何責(zé)任。