首頁 > AI資訊 > 行業動態 > 機器閱讀理解首次超越人類,云從科技自然語言處理創新紀錄

機器閱讀理解首次超越人類,云從科技自然語言處理創新紀錄

新火種    2023-11-15

在圍棋、國際象棋、游戲等領域,智能系統已經超越人類。但在通過閱讀理解,獲取知識上,智能系統此前一直在努力,卻一直未完成超越。不過,這一局面現在發生了改變。3月8日,云從科技和上海交通大學聯合宣布,在自然語言處理(NLP Neuro-Linguistic Programming)上取得重大突破,在大型深層閱讀理解任務數據集RACE數據集(ReAdingComprehension dataset collected from EnglishExaminations)登頂第一,并成為世界首個超過人類排名的模型。(本文圖片均可點擊查看大圖)論文中,云從科技與上海交通大學基于原創DCMN算法,提出了一種全新的模型,使機器閱讀理解正確率提高了4.2個百分點,并在高中測試題部分首次超越人類,其中機器正確率為69.8%,普通人類為69.4%。這意味著,人工智能系統首次在深度閱讀理解超越人類。云從科技是一家孵化于中國科學院重慶研究院的高科技企業,專注于計算機視覺與人工智能。機器在閱讀理解上首次超越人類RACE是一個來源于中學考試題目的大規模閱讀理解數據集,包含了大約28000個文章以及近100000個問題。它的形式類似于英語考試中的閱讀理解(選擇題),給定一篇文章,通過閱讀并理解文章(Passage),針對提出的問題(Question)從四個選項中選擇正確的答案(Answers)。該題型的正確答案并不一定直接體現在文章中,只能從語義層面深入理解文章,通過分析文章中線索并基于上下文推理,選出正確答案。相對以往的抽取類閱讀理解,算法要求更高,被認為是“深度閱讀理解”。由于正確答案并沒有直接使用文章中的話術來回答,不能直接從文中檢索得到答案。因此,智能系統必須從語義層面深入理解文章,才能準確回答問題。據澎湃新聞了解,此次云從科技與上海交通大學設計了的DCMN算法,即Dual Co-Matching Network,這是一種P、Q與A之間的匹配機制,基于這種機制探索性的研究了P、Q與A的各種組合下的匹配策略。此外,除了P與A之間的匹配之外,還可以有Q與A、P與Q之間的匹配,以及不同匹配得到的匹配向量間的組合,這些不同的匹配與組合構成了不同的匹配策略。此次云從科技和交通大學提交的論文中對七種不同的匹配策略分別進行了試驗,從而找到了更加合適的匹配策略 。當智能系統會閱讀理解后大家一定還記得科幻電影《她》中描述的場景:人工智能操作系統薩曼莎在得到主人公的允許后,幫助他閱讀郵件資料,總結出需要保留和刪除的郵件,并幫他修改信件草稿中的錯字,還能與主人公探討她喜愛的信件片段。與此同時,薩曼莎通過閱讀主人公的海量信息來了解他,也通過閱讀互聯網上的海量數據來了解世界。當機器學會閱讀理解后,能幫助我們更有效地處理工作、生活上的事務。

也許你會說科幻電影太超前,以此來作為機器閱讀理解的賣點還為時尚早,但科技公司正努力將電影場景變成現實。據云從科技介紹,公司目前的這一研究成果,在應用領域搭配文字識別OCR/語音識別技術后,將會幫助機器更好地理解人類文字和語言,并廣泛應用于服務領域:幫助企業判斷客戶風險、審計內部文檔合規、從語義層面查找相關信息;在社交軟件、推薦引擎軟件內輔助文字審閱工作,從枯燥的人工文字工作中解放人類。除了云從科技外,國內的科大訊飛、國外的微軟艾倫研究院、IBM、Salesforce、Facebook、谷歌以及CMU(卡內基·梅隆大學)、斯坦福大學等在內的全球自然語言處理領域的研究人員,都在共同推動著自然語言理解的進步。

相關推薦
免責聲明
本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。 交易和投資涉及高風險,讀者在采取與本文內容相關的任何行動之前,請務必進行充分的盡職調查。最終的決策應該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產生的任何金錢損失負任何責任。

熱門文章