首頁 > AI資訊 > 最新資訊 > 大華股份先進技術研究院院長殷?。耗陜葘⑼菩袠I視覺大模型,首先應用于城市管理|財專訪

大華股份先進技術研究院院長殷?。耗陜葘⑼菩袠I視覺大模型,首先應用于城市管理|財專訪

新火種    2023-09-20

7月22日訊(記者 陳抗)AI技術在過去幾年推動安防行業完成了視頻識別、分析、響應處理的不斷升級,但傳統算法正面臨著場景多元化、用戶差異化的挑戰,時下熱門的大模型技術為行業提供了新的可能性。

安防產業鏈的各企業已有不少推出了自己的大模型,比如商湯科技的“日日新”大模型、云從科技的“從容”大模型、宇視科技的“梧桐”行業大模型等。安防龍頭海康威視(002415.SZ)在5月表示,訓練的百億級別參數大模型已應用在AI開發平臺上。

近日,記者專訪了大華股份(002236.SZ)先進技術研究院院長殷俊,他帶領的團隊從2019年開始負責視覺領域大模型的研發,他透露大華股份有望于年內發布自己的大模型。

記者了解到,大華沒有選擇以GPT為代表的生成式語言模型,而是選擇面向不同業務場景研發行業專屬模型,以精確度為前提,正確、客觀地識別和解析,落地行業會優先在城市管理、電力、物流等行業展開。

殷俊認為,應用落地是衡量大模型成功與否的唯一標準。因此,大華專注于在已有的應用場景加速落地,這也是目前急需突破的方向。

今年3月決策,圍繞視覺方向啟動行業大模型

:大華是從什么時候開始做大模型的?

殷?。何覀儚?019年開始,那時候不叫大模型,稱為Transformer技術。團隊用ViT技術做半自動化標注方案,節省很多人力,2020年初就有了檢測+分割+分類的自動化標注模型。

今年年初大模型研討會之后,公司決策要做行業專屬大模型,并額外追投研發預算,也追加了40-50個算法人員的投入。

我們對大模型確立了三個方向:第一,我們不做主流的通用大模型,而是面向業務場景做行業專屬大模型;第二,我們不做ChatGPT那樣的文本生成式AI,還是圍繞視覺方向;第三,我們要重點投入私有化部署,因為大華客戶的很多數據是需要做到合規安全,要用到私有云。

大華會在不同時間段推出各類行業大模型,今年就會發布。

:現在一些行業頭部公司已經在做細分行業的大模型,比如恒生電子有針對金融數據分析的大模型,那么大華的競爭優勢是什么?

殷?。何覀兊拇竽P筒皇轻槍鹑陬I域的數據分析,而是通過數智化手段提升管理質量和效率。以城市管理為例,針對一個路口就有幾十條紛繁多樣的管理規范要求,包括出攤經營、井蓋識別、小廣告“牛皮癬”、盲道侵占等等。我們的優勢是有豐富的行業客戶、行業經驗、行業的作業流程經驗。

通用大模型對云廠家很友好,但需要非常大體量的算法去跑,采用超大規模參數的算法對用戶的使用成本太高,我們會在訓練和推理優化技術上做一個平衡,讓用戶在成本可控的情況下使用大模型。

:大模型從研發到落地的過程中,最大的難點是什么?

殷俊:研發難點有很多,首先是在視覺領域沒有可參照的模型架構,和現在大眾認知的AGI、AIGC技術方向存在差異,在CV(Computer Vision計算機視覺)領域完全靠自己搭建。

因為選擇路徑不同,所以在數據源的處理上,也要靠自己摸索,包括數據對齊、圖像描述等。訓練框架也是個難點,多模態大模型是由多個大模型組合的,數據輸入以視頻為主,音頻、雷達、激光數據為輔,輸出都要以文本為主,視頻轉換為文本的過程都需要自己摸索。

此外落地的難點還有如何將模型小型化,這也是我們下半年的重點,例如研發出一套100億參數的大模型,怎么用算法把它小型化,讓這個模型可以低成本地運行起來。大算力高成本的大模型很難打動客戶,我們一定要先去幫客戶考慮使用成本的問題。

之前說到我們的私有云部署,這也涉及到成本控制,公有云用戶考慮服務費用,而私有云用戶因為要自己搭建云,所以關注服務+建設兩部分的成本,對成本控制更在意。

優先落地城市管理行業,未來大模型或迎洗牌

:大華的大模型技術會優先在哪些行業落地?

殷俊:從行業剛需出發,目前我們在考慮城市管理(行業),因為城市管理的需求非常多,環境千差萬別,任務需求多但需求明確;其次就是電力行業,儀器儀表操作復雜、設備種類繁多且安全性要求高。此外,像物流行業中的條碼掃描,有很多遮擋、破損、污跡、移位各方面的問題,我們也想試試大模型能不能進一步提升類似的識別能力。

:現在大模型競爭白熱化,算力優化被認為是競爭核心,您如何看待?

殷?。含F在大家都在做的通用大模型,很耗算力,大模型又在風口上,算力很難采購,導致了一個爭奪算力的局面。

我覺得并非算力越大模型就越好,而且我們做行業專屬大模型,不需要那么大參數量的算法體系。對我們來說,大模型已經有雛形,重點是如何落地,我們是奔著產業化去的,不能只停留在技術層面,“只能看不能用”是不行的。

:您如何看待未來一年大模型的發展?

殷?。汗具x擇做大模型,要看是否對主營業務有所升級,比如科大訊飛(002230.SZ)的大模型可以提升NLP業務,百度大模型可以升級搜索引擎,恒生大模型對金融數據分析業務有提升。所以大華也會首選在現有業務的基礎上,根據客戶需求去研發大模型。

大模型技術能夠不斷增強智慧視覺等垂直應用領域解決方案的競爭力,解決現在的問題和大量的需求,幫助我們不斷完善方案。當然大模型的發展對公司在研發成本控制、資源整合、精細化管理等方面也有很大幫助。

未來行業肯定會洗牌,能快速產業化的公司才能活下來,每個細分領域會出現頭部玩家。大模型技術也會對已有的行業格局有所沖擊,布局方向對不對,能不能落地,都是很關鍵的節點。

(編輯 劉琰)

相關推薦
免責聲明
本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。 交易和投資涉及高風險,讀者在采取與本文內容相關的任何行動之前,請務必進行充分的盡職調查。最終的決策應該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產生的任何金錢損失負任何責任。

熱門文章