首頁(yè) > AI資訊 > 最新資訊 > 艾倫人工智能研究院推出PyTorch上的NLP庫(kù)

艾倫人工智能研究院推出PyTorch上的NLP庫(kù)

新火種    2024-12-13
李林 編譯整理量子位 出品 | 公眾號(hào) QbitAI
微軟聯(lián)合創(chuàng)始人保羅·艾倫建立的艾倫人工智能研究院(AI2)今天發(fā)布了一個(gè)PyTorch上的開(kāi)源自然語(yǔ)言處理(NLP)研究庫(kù):AllenNLP。
這個(gè)庫(kù)提供靈活的數(shù)據(jù)API,能實(shí)現(xiàn)智能的batching和padding,對(duì)文本處理中的常見(jiàn)操作進(jìn)行高層抽象,還提供了一個(gè)模塊化、可擴(kuò)展的實(shí)驗(yàn)框架。
AllenNLP包含3個(gè)模型:機(jī)器理解、語(yǔ)義角色標(biāo)注和文本蘊(yùn)含。
其中,機(jī)器閱讀理解(MC)模型能夠從一段文本中選擇一段,來(lái)回答自然語(yǔ)言問(wèn)題。AllenNLP中的MC模型是Seo et al, 2017論文提出的BiDAF(雙向注意流)的實(shí)現(xiàn)。AllenNLP的BiDAF模型在SQuAD數(shù)據(jù)集上測(cè)試的EM成績(jī)是68.7,略好于原始BiDAF模型的67.7分,訓(xùn)練速度也是原來(lái)的10倍。
語(yǔ)義角色標(biāo)注(SRL)模型能從一個(gè)句子中還原出它的潛在謂詞參數(shù)結(jié)構(gòu),還能為回答“誰(shuí)”對(duì)“誰(shuí)”做了“什么”這類關(guān)于句子含義的基本問(wèn)題而建立表示。AllenNLP的SRL模型是He et al, 2017論文提出的deep BiLSTM的實(shí)現(xiàn),性能與原文的模型相當(dāng),在CoNLL 2012上的F1得分為78.9。
當(dāng)處理一對(duì)句子的時(shí)候,文本蘊(yùn)含(TE)模型能預(yù)測(cè)第一個(gè)句子中的事實(shí)是否隱含了第二個(gè)句子中的事實(shí)。AllenNLP的TE模型是Parikh et al, 2017論文中可分解注意模型的實(shí)現(xiàn),在SNLI數(shù)據(jù)集上達(dá)到了84.7的準(zhǔn)確率,接近原始模型86.3%的成績(jī)。
AllenNLP由AI2與華盛頓大學(xué)等高校的研究者合作開(kāi)發(fā)和維護(hù)。
關(guān)于這個(gè)庫(kù)的更多信息,以及文中提到的3個(gè)模型,見(jiàn)以下鏈接:
AllenNLP主頁(yè):http://allennlp.org/
論文:http://allennlp.org/papers/AllenNLP_white_paper.pdf
GitHub地址:https://github.com/allenai/allennlp
Demo:http://demo.allennlp.org/
安裝指南:http://allennlp.org/tutorials/installation
機(jī)器閱讀理解模型 - BiDAF (Seo et al, 2017):https://www.semanticscholar.org/paper/Bidirectional-Attention-Flow-for-Machine-Comprehen-Seo-Kembhavi/007ab5528b3bd310a80d553cccad4b78dc496b02
語(yǔ)義角色標(biāo)注模型 - deep BiLSTM model (He et al, 2017):https://homes.cs.washington.edu/~luheng/files/acl2017_hllz.pdf
文本蘊(yùn)含模型 - 可分解注意模型(Parikh et al, 2017):https://www.semanticscholar.org/paper/A-Decomposable-Attention-Model-for-Natural-Languag-Parikh-T%C3%A4ckstr%C3%B6m/07a9478e87a8304fc3267fa16e83e9f3bbd98b27
相關(guān)推薦
免責(zé)聲明
本文所包含的觀點(diǎn)僅代表作者個(gè)人看法,不代表新火種的觀點(diǎn)。在新火種上獲取的所有信息均不應(yīng)被視為投資建議。新火種對(duì)本文可能提及或鏈接的任何項(xiàng)目不表示認(rèn)可。 交易和投資涉及高風(fēng)險(xiǎn),讀者在采取與本文內(nèi)容相關(guān)的任何行動(dòng)之前,請(qǐng)務(wù)必進(jìn)行充分的盡職調(diào)查。最終的決策應(yīng)該基于您自己的獨(dú)立判斷。新火種不對(duì)因依賴本文觀點(diǎn)而產(chǎn)生的任何金錢損失負(fù)任何責(zé)任。

熱門文章