「直擊引領區」如何擷取人工智能皇冠上的明珠,來看這名“浦東新區科技精英”的創業故事
在當今的人工智能產業里,文本識別是最難的領域,比爾蓋茨說,文字資料處理是人工智能皇冠上的明珠。為了從皇冠上擷取這顆明珠,陳運文博士及其所創辦的達觀數據努力耕耘七載,推出代表國內“文本智能處理”最高水準的曹植垂直大模型。
三次工作經歷決定創業方向
從象形文字到甲骨文,從雕版印刷到活字印刷,從計算機到大數據,人類對文字處理的升級迭代,如劃破寂寂長夜的流星,在茫茫宇宙中照亮整片夜空。作為文字發展的延續,文本智能處理是計算機科學、AI、語言學的交叉領域,經歷了第一代符號主義、第二代語法規則、第三代統計學習,文本挖掘工作目前處于第四代深度學習階段,將實現用一個復雜的模型模擬人腦神經網絡運作,從而能夠像人類一樣進行說文解字。
回望人工智能曲折起伏的60余年,人們曾熱衷于各種人機大戰,相較之下,“文本智能處理”是又難又不易被感知到的“小事”。在復旦讀博時,陳運文開始觸及到文本智能處理,他的論文獲得上海市優秀博士論文獎,當時人工智能的概念并非熱門,學習和研究的更多叫機器學習(Machine Learning)和模式識別(Pattern Recognition),陳運文只是感覺這些技術確實挺有意思,也非常有實用意義。
似乎冥冥中的安排,畢業后陳運文在百度負責搜索引擎算法研發的工作,使用到自然語言處理和數據挖掘的技術,也實踐了各類機器學習算法。在盛大研究院和盛大文學負責大數據中心的工作,同樣每天的主要精力也在處理海量的文字資料,包括之后在騰訊文學以及閱文集團也是負責自然語言處理的團隊工作。這三次工作經歷,加上看好自然語言處理技術的產業應用前景,引導他選擇了如今的創業方向。
“進窄門、走遠路、見微光”
2015年,陳運文在張江“天之驕子孵化器”里敲下了第一行代碼,帶著30余人的團隊創業,租了孵化器里一間20多平方米的辦公室,對于那段經歷,陳運文回憶道,雖然孵化器空間不大,但和其他創業者一起奮斗的感覺特別棒。在陳運文的認知中,創業的過程好比“進窄門、走遠路、見微光”,選擇方向時要有自己的堅持,有些看上去沒那么眾人皆知的領域,可能反而蘊藏著機會。在人機大戰占據人工智能主流發展趨勢時,他把目光投向文本智能處理這道“窄門”,發現了其中巨大的市場潛力。創業前陳運文接觸過大量的C端用戶,創業后意外發現在ToB領域價值,文本智能處理技術的市場更廣闊,且在國內處于真空地帶,發現到這個商機,陳運文義無反顧的投身其間。

在文本智能處理領域苦耕7年,從技術落地到創造價值,達觀數據成為國內文本智能行業的翹楚,為眾多企業提供多場景的智能文本處理產品,為“智慧辦公”創造了條件。疫情期間,達觀智能文本處理平臺協助企業和政府進行疫情防控輔助的工作。上海每輪核酸篩查需要處理2000余萬人的信息,使用達觀智能文本處理平臺效率提升30倍以上。
從2022年底,陳運文敏銳意識到這是人工智能進入新階段的大年,得益于ChatGPT的發展,達觀研發的國產版GPT“曹植”大語言模型LLM系統可以說是站在了ChatGPT“巨人的肩膀”上。“曹植”大語言模型作為一款垂直、專用、國產的大模型,具備長文本、多語言、垂直化三大特點,創新性地采用了多模型并聯(Ensemble)架構,通過將不同參數規模和不同類型的模型相結合,未來將可持續賦能金融、政務、制造等多個垂直領域和通用場景人工智能的落地和發展。
為母校設立“達觀數據獎學金”
因為在文本智能處理領域中的成就,陳運文及企業獲得了中國人工智能領域最高獎“吳文俊人工智能獎”,被評為行業首家國家級專精特新“小巨人”企業,入選胡潤百富獨角獸企業,福布斯科技創新50強,國際權威咨詢集團IDC創新者,德勤授予的科技創新明日之星等國際獎項。
2021年,他為母校捐資設立“達觀數據獎學金”,表達其對教育事業和計算機人才培養的關愛和支持,以及對復旦大學優秀學生成長成才的殷切期盼。而今,數據深度學習的革命方興未艾,人工智能作為新一輪科技革命和產業變革的重要驅動力量,正在深刻改變世界。上海浦東作為人工智能的高地,正多點突破,加速搶跑。達觀也在全力跑出加速度,沖出上海,走向全國,摘取人工智能皇冠上的明珠。
編輯:魯琳
資料:區科協
* 轉載請注明來自浦東發布官方微信


- 免責聲明
- 本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。 交易和投資涉及高風險,讀者在采取與本文內容相關的任何行動之前,請務必進行充分的盡職調查。最終的決策應該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產生的任何金錢損失負任何責任。