詳解Transition-based Dependency parser基於轉移的依存句法 ...
文章推薦指數: 80 %
Joint POS Tagging and Dependency Parsing with Transition-based Neural Networks. ... 中文任務全面超越BERT:百度正式發布NLP預訓練模型ERNIE.
人人焦點
影視
健康
歷史
數碼
遊戲
美食
時尚
旅遊
運動
星座
情感
動漫
科學
寵物
家居
文化
教育
故事
詳解Transition-basedDependencyparser基於轉移的依存句法解析器
2021-02-20機器學習算法與自然語言處理
主講:余南整理:甄冉冉導師:付國宏張梅山出自:黑龍江大學自然語言處理實驗室周末討論班轉載自公衆號【深度學習自然語言處理】以下圖片,來自於余南師兄依存句法樹就是表示一個句子中詞與詞之間的依存關係,如下圖其中兩個詞之前的弧表示這兩個詞有依存關係,弧上的標籤爲二者的關係,弧的始發點爲父親節點,箭頭指向爲孩子節點。
比如The和fox是冠詞+名詞(det)的名詞短語。
除了一個詞,即根節點(這裡爲jumped)外,其他詞都有詞作爲父親節點,而該根節點(jumped)的父親節點爲root。
但是注意,依存句法樹是不允許弧之間有交叉或者迴路!依存句法樹的文本表示格式爲conll格式,如表根據該表的父親節點索引和對應的弧上關係就能還原該依存句法樹。
其中-1表示根節點。
我們通常將依存句法的特徵融入到其他任務模型里,比如機器翻譯、意見挖掘、語篇分析等,一般能得到更好的性能。
那怎麼得到依存句法特徵呢?通常有兩種方法:什麼是Transition-based基於轉移的框架?這個框架由狀態和動作兩部分構成,其中狀態用來記錄不完整的預測結果,動作則用來控制狀態之間的轉移。
用在生成依存句法樹上,則具體表示爲從空狀態開始,通過動作轉移到下一個狀態,一步一步生成依存句法樹,最後的狀態保存了一個完整的依存樹。
依存分析就是用來預測詞與詞之間的關係,現在轉爲預測動作序列。
在基於轉移的框架中,我們定義了4種動作(棧頂的元素越小表示離棧頂越近):ps:下沉的意思0下沉,視覺效果能看出是1的孩子所以,我們基於轉移的依存句法分析器就由預測樹結構問題轉爲預測動作序列問題。
使得問題簡單了不少。
Transition-based基於轉移的具體例子還是以上面的依存樹爲例:一整套依存分析的動作序列(金標,訓練數據)就變爲:詳細解釋下:初始狀態棧爲空,隊列爲整個文本的數字序列。
這個時候只能進行移進shift操作:因爲左邊棧對一個元素0,還是只能進行移進shift操作:這個時候棧中有2個元素,我們此時看依存樹0、1之間並沒有弧,不能進行規約,所以還是只能shift:此時看棧頂兩元素,發現依存樹中1、2之間有依存關係而且1爲2的孩子,所以此時的動作爲左規約arc_left,1下沉,爲2的孩子(此時實際操作爲1被踢出棧,棧里剩爲0、2,踢出是因爲最後能根據動作序列還原整個依存樹,當然也爲了接下來的操作方便),此時標籤爲amod:此時棧里爲0、2,再次查看依存樹發現0、2之間有依存關係,其中0爲2的孩子,所以此時操作爲左規約,此時標籤爲det...中間略過一些步驟,因爲都是同理,這次說下第9步:此時棧中爲3、4,查看依存樹按照正常操作,此時應該arc_right右規約,但是如果真的4就下沉,就沒了。
而一會5要入棧,再查看依存樹發現4是自己的爸爸,天吶,5的爸爸沒了,找不到了,消失了,其他詞都有爸爸,就5沒有,還有比這個更慘的嗎?這就沒發再進行操作了!所以,還有一個潛規則如果操作爲棧頂元素要進行arc_right時,不執行該操作,而選擇shift。
而你可能會問arc_left會有這樣的問題嗎?不會啦,比如3、4進行arc_left操作,3下沉,如果右邊的隊列中有父親節點是3,那麼就表示該依存樹有交叉或者迴路!這種是不可能發生的,因爲依存樹不允許有交叉或者迴路!(不信的話,你自己畫畫試試)最後說下,pop_root根彈出操作,只能發生在最後右下角的數據爲詞與詞之間的關係,這個就是根據動作序列生成的依存關係(父親,孩子,關係),根據該關係,就能還原成原來的依存樹。
我們用神經網絡來進行特徵抽取,該網絡共分爲2部分:編碼端:用來負責計算詞的隱層向量表示解碼端:用來解碼計算當前狀態的所有動作得分編碼端我們用Bi-LSTM來編碼一個句子,計算對應的隱層表示。
公式表示爲:其中,爲詞向量,爲詞性向量,爲向量拼接。
具體解釋:解碼端解碼端就需要對每一個狀態打出所有動作的得分。
根據經驗,認爲棧頂三元素和隊列首元素爲動作預測關鍵特徵,於是將棧頂三元素(下標越小離棧頂越近)和隊列首元素進行拼接。
然後用線性變換計算每一個動作的分數:模型預測對每一個動作的分數進行Softmax概率化,然後輸入到交叉熵中,作爲目標函數。
然後再用Adam來進行更新模型參數,最小化目標函數:其中爲金標動作序列的概率,爲模型參數。
http://aclweb.org/anthology/C18-1047Transition-basedNeuralRSTParsingwithImplicitSyntaxFeaturesNanYu,MeishanZhangandGuohongFuhttps://arxiv.org/pdf/1704.07616.pdfJointPOSTaggingandDependencyParsingwithTransition-basedNeuralNetworks.LinerYang,MeishanZhang,YangLiu,NanYu,MaosongSun,GuohongFu.https://www.mitpressjournals.org/doi/pdfplus/10.1162/tacl_a_00101SimpleandAccurateDependencyParsingUsingBidirectionalLSTMFeatureRepresentationsEliyahuKiperwasse,YoavGoldberghttp://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.164.1639&rep=rep1&type=pdfIntegratingGraph-BasedandTransition-BasedDependencyParsersJoakimNivre,RyanMcDonald 余南師兄的代碼:c++:https://github.com/yunan4nlp/NNDepParserpytorch:https://github.com/yunan4nlp/Tb_DepParserMF_ARC推薦閱讀:中文任務全面超越BERT:百度正式發布NLP預訓練模型ERNIE從Word2Vec到Bert,聊聊詞向量的前世今生(一)華爲起訴美國政府
相關焦點
【NLP】依存句法分析你真的學會了嗎
內容速遞句法分析(SyntacticParsing),兩種典型的句法結構表示:(1)短語結構句法:依託上下文無關文法,S代表起始符號,如NP和VP分別表示名詞短語和動詞短語。
(2)依存結構句法:依託依存文法,如sub和obj分別表示主語和賓語,root表示虛擬根節點,其指向整個句子的核心謂詞。
dependencyparsing是依存關係語法分析,簡稱爲依存分析。
【CS224n筆記】L5DependencyParsing
Greedytransition-basedparsing[Nivre2003]Basictransition-baseddependencyparserANeuralgraph-baseddependencyparser [DozatandManning2017;Dozat,Qi,andManning2017]在神經模型中爲基於圖的依賴分析注入活力
【一分鐘論文】DeepBiaffineAttentionforNeuralDependencyParsing
作用是識別出句子中的短語結構以及短語之間的層次句法關係。
依存關係分析,又稱依存句法分析(dependencysyntacticparsing),簡稱依存分析(denpendencyparsing),作用是識別句子中詞與詞之間的相互依存關係。
一文讀懂依存句法分析
句法分析(syntacticparsing)是自然語言處理中的關鍵技術之一,它是對輸入的文本句子進行分析以得到句子的句法結構的處理過程。
對句法結構進行分析,一方面是語言理解的自身需求,句法分析是語言理解的重要一環,另一方面也爲其它自然語言處理任務提供支持。
例如句法驅動的統計機器翻譯需要對源語言或目標語言(或者同時兩種語言)進行句法分析。
句法分析綜述
句法分析,尤其針對依存句法分析,主要有基於動態規劃,基於決策,基於融合的方法,當然還有一些擴展性的方法。
基於動態規劃的方法基於動態規劃的方法,其實就是直接對依存樹進行分析。
Integratinggraph-basedandtransition-baseddependencyparsers.InACL.[9]W.JiangandQ.Liu.Dependencyparsingandprojectionbasedonword-pairclassification.InACL,2010.
一個快要被NLP人遺忘的方向:句法分析
句法分析包含:成分句法分析(constituentsyntacticparsing) 依存句法分析(dependencysyntacticparsing
依存句法分析的任務以及形式化定義
在依存句法中,共同的基本假設是:句法結構本質上包含詞和詞對之間的關係。
這種關係就是依存關係(dependencyrelations)。
其中一個依存關係連接兩個詞,一個是核心詞(head)一個是修飾詞(dependant)。
依存句法分析結果的一種典型表示形式爲依存句法樹。
《P4語言規範》parser詳解
p4解析器是基於有限狀態機的思想來設計的。
解析器中解析的過程可以被一個解析圖(parsergraph)所表示,解析圖中所表示的某一個狀態(或者說,在P4語言中的某一個解析函數)看做是一個狀態節點,每一個狀態轉換等同於跨越狀態節點之間的邊界。
下面的P4代碼展示了關於mTag包處理的解析器內容中的部分解析函數。
從零開始學自然語言處理(七)——句法結構分析
進行句法分析。
句法分析分爲句法結構分析(syntacticstructureparsing)和依存關係分析(dependencyparsing)。
以獲取整個句子的句法結構爲目的的稱爲完全句法分析,而以獲得局部成分爲目的的語法分析稱爲局部分析,依存關係分析簡稱依存分析。
今天我們看看句法結構分析。
Google發布自然語言處理解析器SLING,免除模塊化分析級聯效應產生...
雷鋒網AI科技評論消息,日前,Google發布自然語言框架語義解析器詳細消息雷鋒網(公衆號:雷鋒網)AI科技評論編譯整理如下:直到最近,大多數實際的自然語言理解(NLU)系統都採用的是從詞性標籤和依存句法分析(dependencyparsing)到計算輸入文本的語義表示的分析。
雖然這使得不同分析階段易於模塊化,但前期的錯誤會在後期和最終表示上產生層疊效應,中間階段的輸出也可能會與這一階段本身並不相關。
圖文並茂帶你了解依存句法分析
成分句法分析關心的是,某兩個相鄰詞彙能不能接在一起構成成分(廣義的mention)。
而依存句法分析關係的是,兩個詞彙之間的關係(entityrelation)。
依存解析不關心兩個詞彙是否一定要相鄰。
比如book和flight沒有直接相連,但是flight是book的賓語,book是flight的主語。
我們會用一個從book指向flight的箭頭來表示這種依存關係。
箭頭的起始我們叫作head。
聯合漢語分詞和依存句法分析的統一模型:當前效果最佳
因此,本文提出一種基於圖的統一模型來解決這些問題。
這種模型將漢語分詞和依存句法分析集成在一個分析模型中。
它比以前的聯合模型性能更好,並在漢語分詞和依存句法分析中實現了當前最佳的結果。
與英語不同,漢語句子由連續的字符組成,詞語之間缺乏明顯的界限。
上海科技大學屠可偉團隊:小談無監督依存句法解析
一般而言,我們把從一個句子到句法樹的這一過程稱爲句法解析(parsing)。
句法解析有很多種形式,最爲常用的是基於短語的句法解析(constituencyparsing)和依存句法解析(dependencyparsing)。
依存句法分析
在自然語言處理中,我們有時不需要或者不僅僅需要知道整個句子的短語結構樹,而且要知道句子中詞與詞之間的依存關係。
用詞與詞之間的依存關係來描述語言結構的框架稱爲依存語法,又稱從屬關係語法。
利用依存語法進行句法分析也是自然語言理解的重要手段之一。
AAAI論文解讀:基於轉移的語義依存圖分析(11月24日周五晚8點直播)
本文提出一種基於轉移的分析器,使用list-basedarc-eager算法的變體對依存圖進行分析,並提出了兩種有效的神經網絡模塊,分別用於獲得轉移系統中緩存和子圖更好的表示。
該系統在中英數據集上都取得了很好的結果,並且還能通過簡單的模型融合方法進一步提高性能。
JavaScript實現JSON解析器
編寫JSON解析器所需的知識和技術可以轉移到編寫JS解析器中。
因此,讓我們開始編寫JSON解析器!理解語法如果您查看了規範頁面,會發現有2個圖。
一個是可視化的,另一個是基於文本的。
基於文本的語法(Backus-Naur形式)通常被提供給另一個解析器,該解析器解析該語法並爲其生成一個解析器。
🤯在本文中,我們將重點關注鐵路圖,因爲它是可視化的,而且似乎對我更友好。
NLP句法結構解析樹
句法解析是NLP中的一種關鍵技術,可以幫助分析句子的成分結構,以及單詞之間的依存關係。
句法分析樹主要分兩大類:constituenttree短語結構樹,dependencytree依存結構樹。
本文主要簡單介紹一下短語結構樹和依存結構樹的概念。
百度中文依存句法分析工具DDParser等你來體驗!
繼百度詞法分析工具LAC2.0開源之後,8月4日,百度NLP又重磅發布了中文依存句法分析工具—DDParser!相較於目前的其他句法分析工具,DDParser基於大規模標註數據進行模型的訓練,採取了更加簡單易理解的標註關係,並且支持一鍵安裝及調用,更加適合開發者快速學習及使用。
延伸文章資訊
- 1自然语言处理:依存句法解析(Dependency Parsing)
- 2dependency parsing 中文- 相依剖析依存關系句法分析
dependency parsing中文:相依剖析…,點擊查查權威綫上辭典詳細解釋dependency parsing的中文翻譯,dependency parsing的發音,音標,用法和例句等。
- 3句法分析:依存分析(Dependency Parsing)_满腹的小不甘
依存关系分析,又称依存句法分析(dependency syntactic parsing),简称依存分析,作用是识别句子中词汇与词汇之间的相互依存关系。依存句法分析属于 ...
- 4詳解Transition-based Dependency parser基於轉移的依存句法 ...
Joint POS Tagging and Dependency Parsing with Transition-based Neural Networks. ... 中文任務全面超越BERT:...
- 5依存句法解析(Dependency Parsing)三种自然语言处理的不同 ...
依存句法解析(Dependency Parsing)三种自然语言处理的不同方法|spaCy、NLTK、Stanford CoreNLP、Stanza. 2021年08月02日17:07 · 阅读...