首頁 > AI資訊 > 最新資訊 > 解決現有技術處理困境作業幫公開“自然語言處理”相關專利

解決現有技術處理困境作業幫公開“自然語言處理”相關專利

新火種    2023-11-22

深度語義模型是目前最先進的表示學習技術,可以很好解決通用領域的語義表示,但在具體領域場景下進行應用時,往往區分能力不足。近日,記者從國家知識產權局官網獲悉,作業幫公開了一項名為“自然語言處理方法、裝置及電子設備”的發明專利。

此項專利由作業幫教育科技(北京)有限公司于2020年12月提出申請并于2021年3月公開,申請公布號為CN112528654A。該發明提出了一套新的領域內表示學習框架技術,可以結合領域內數據,面向領域內具體任務,融合多粒度表示框架,集成多種預訓練模型來實現更有領域內語義區分能力的表示學習。

現有自然語言處理技術在具體場景落地時存在諸多困境。比如現有技術中的自然語言處理過程,均為基于某種單一粒度方式進行的,而在實際的中文中,單字、單詞、短句等不同粒度都能表達不同的含義。再有,現有技術中的自然語言處理模型大都基于寬泛的通用語料庫進行訓練,力求得到一個適用于所有場景的自然語言處理模型,在處理具體領域場景任務時,語義區分度往往不足。以上兩點使得現有技術中的自然語言處理模型在具體領域場景落地時無法達到滿意的實用效果。

專利摘要中顯示,本發明屬于計算機信息處理技術領域,提供一種自然語言處理方法、裝置、電子設備及計算機可讀介質,該方法包括:對文本數據中的文字進行分詞處理以獲取文字和/或詞匯;將所述文本數據和其對應的領域屬性輸入文字向量模型中,獲取字向量;將所述文本數據和其對應的領域屬性輸入詞匯向量模型中,獲取詞向量;基于所述文本數據確定所述文字對應的第一權重和/或所述詞匯對應的第二權重;通過所述字向量、所述第一權重和/或所述詞向量、所述第二權重確定所述文本數據的句子語義向量;基于所述句子語義向量對所述實時文本數據進行自然語言處理。本發明能夠有效提升句子的語義表達能力。

該專利發明人之一作業幫中臺產研中心蔣宏飛博士表示,本發明是一種通用的底層表示學習技術,可廣泛應用于各種場景的自然語言處理下游任務:比如:文本分類、語義相似度計算、文本聚類、文本結構化分析等。在智能搜索、智能問答、異常發現、智能質檢、用戶意見挖掘等場景應用中顯著提升應用指標。本方法屬于無監督學習,無需依賴標注資源,實現起來高效便捷。

免責聲明:市場有風險,選擇需謹慎!此文僅供參考,不作買賣依據。

相關推薦
免責聲明
本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。 交易和投資涉及高風險,讀者在采取與本文內容相關的任何行動之前,請務必進行充分的盡職調查。最終的決策應該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產生的任何金錢損失負任何責任。

熱門文章