基於搭配詞將中文倒裝句還原 - 臺灣聯合大學博碩士論文系統

文章推薦指數: 80 %
投票人數:10人

論文名稱(中文):, 基於搭配詞將中文倒裝句還原. 論文名稱(外文):, Revert the Chinese inverted sentences base on Collocation. 指導教授(中文):, 許聞廉. 資料載入處理中... 圖書館首頁| 網站地圖| 首頁| 本站說明| 聯絡我們| 相關資源| 台聯大論文系統| 操作說明 | English 簡易查詢 進階查詢 論文瀏覽 熱門排行 我的研究室 上傳論文 建檔說明 常見問題 帳號:guest(178.128.221.219)          離開系統 字體大小:       詳目顯示 第1筆/ 共1筆  /1頁 以作者查詢圖書館館藏、以作者查詢臺灣博碩士論文系統、以作者查詢全國書目 論文基本資料 摘要 外文摘要 論文目次 參考文獻 電子全文 作者(中文):陳立強作者(外文):Chen,Li-Chiang論文名稱(中文):基於搭配詞將中文倒裝句還原論文名稱(外文):ReverttheChineseinvertedsentencesbaseonCollocation指導教授(中文):許聞廉指導教授(外文):Hsu,Wen-Lian口試委員(中文):張詠淳馬偉雲口試委員(外文):Chang,Yung-ChunMa,Wei-yun學位類別:碩士校院名稱:國立清華大學系所名稱:資訊工程學系學號:106062628出版年(民國):108畢業學年度:107語文別:中文論文頁數:58中文關鍵詞:語意理解、搭配詞、詞向量、句子改寫、主幹抽取外文關鍵詞:semanticunderstanding、collocation、wordvector、sentencerewriting、stemextraction相關次數: 推薦:0點閱:25評分:下載:23收藏:0 語意理解是自然語言處理發展史中,最悠久、最重要也最困難的一項任務,過去人們使用了語意網路,本體論,斷詞,詞性標註,句法分析,依存分析等等方式,去理解並操作自然語言,近年來深度學習的崛起,也讓人們有更多方式研究語意理解。

本章使用了基於深度學習訓練的詞向量,將詞之間的關係程度抽取出來,關係程度高的,即為搭配詞,一個句子的知識,可以由句子中詞與詞之間的搭配關係看出端倪,我們將多種搭配關係定義出來,並且在大量文本中精準的抓出搭配詞組。

搭配詞程度描述了詞與詞之間的關係,我們也使用了搭配詞的程度,應用在中文倒裝句的還原。

要理解一個句子,常見的有句法剖析,然而中文倒裝句因為中文文法的關係,使用句法剖析的效果不佳,為了處理中文倒裝句的問題,我們將中文倒裝句,利用搭配詞將倒裝句的前綴詞、主詞、動詞、受詞、後綴詞定位出來,並將其按照較常見的文法重新排序,讓此倒裝句還原並可以被語法剖析並且被理解。

對於已知是倒裝句的句子,我們已成功還原了50%的倒裝句,並提出後續的展望。

Semanticcomprehensionisthelongest,mostimportantandmostdifficulttaskinthehistoryofnaturallanguageprocessing.Inthepast,peopleusedsemanticnetworks,ontology,wordsegmentation,part-of-speechtagging,syntacticanalysis,dependencyanalysis,etc.tounderstandandoperatingnaturallanguage.Withtheriseofdeeplearninginrecentyearshasalsoenabledpeopletostudymoresemanticunderstanding.Thischapterusesthewordvectorbasedondeeplearningtoextractthedegreeofrelationshipbetweenwords.Whentherelationshipishigh,thatis,thecollocation,theknowledgeofasentencecanbeseenfromthecollocationbetweenwordsandwordsinthesentence.Inthischapter,wedefineavarietyofcollocationsandaccuratelycapturethecollocationphrasesinalargeamountoftext.Thedegreeofcollocationdescribestherelationshipbetweenwordsandwords.WealsousethedegreeofcollocationstoapplytherestorationofChineseinvertedsentences.Tounderstandasentence,thereisacommonsyntacticanalysis.However,becauseoftheChinesegrammar,theuseofsyntacticanalysisisnotgood.InordertodealwiththeproblemofChineseinvertedsentences,weusecollocationtolocatetheprefix,main,verb,accept,andsuffixwordsoftheinvertedsentence,thenreorderedaccordingtothemorecommongrammar,sothattheinvertedsentencecanberestoredandcanbeparsedandunderstood.Forsentencesthatareknowntobeinvertedsentences,wehavesuccessfullyrestored50%oftheinvertedsentencesandproposedafollow-upoutlook. 摘要iiABSTRACTiii誌謝ivLISTOFFIGURESviiiLISTOFTABLESxiChapter1緒論11.1研究目的與動機11.1.1自然語言處理11.1.2基於規則與基於統計11.1.3中文自然語言處理41.2研究主題51.2.1語意51.2.2句子改寫61.3章節概要6Chapter2相關研究82.1詞向量82.2句法剖析器102.3搭配詞組相關研究112.3.1使用語法剖析器抽取搭配詞112.3.2使用依存句法剖析器抽取搭配詞132.3.3使用統計方法抽取搭配詞14Chapter3搭配詞抽取163.1搭配詞組定義163.2搭配詞組抽取之系統架構183.2.1詞向量網路建置193.2.2搭配詞程度之數學模型203.2.3精確搭配實體抽取21Chapter4句子改寫234.1倒裝句定義234.2倒裝句剖析問題244.3倒裝句改寫264.3.1定位動詞264.3.2定位受詞與主詞274.3.3倒裝句還原274.4倒裝句辨識31Chapter5實驗結果與討論335.1搭配詞抽取335.1.1資料集335.1.2評估方式335.1.3樣本選擇375.1.4詞性分類標準385.1.5資料量與準確度395.2倒裝句還原425.2.1倒裝句資料集425.2.2倒裝還原句評估方式425.2.3倒裝還原正確率435.2.4倒裝還原句錯誤分析435.2.5還原後剖析結果485.3倒裝句辨識52Chapter6結論與未來工作55REFERENCE57 [1]DPearce.SynonymyinCollocationExtraction.ProceedingsoftheworkshoponWordNetandother[2]JWermter,UHahn.2004.CollocationExtractionBasedonModifiabilityStatistics.Proceedingsofthe20thinternationalconference[3]RogerLevyandChristopherD.Manning.2003.IsithardertoparseChinese,ortheChineseTreebank?ACL2003,pp.439-446.[4]謝佑明,楊敦淇,陳克健,2004,"語法規律的抽取及普遍化與精確化的研究",ProceedingsofROCLINGXVI,pp.141-150.[5]RichardSocherrichardCliffChiung-YuLinchiungyuAndrewY.NgangChristopherD.Manning,ParsingNaturalScenesandNaturalLanguagewithRecursiveNeuralNetworks.ComputerScienceDepartment,StanfordUniversity,Stanford,CA94305,USA[6]Yu-MingHsieh,andWei-YunMa.2016.N-bestRescoringforParsingBasedonDependency-BasedWordEmbeddings.InternationalJournalofComputationalLinguisticsandChineseLanguageProcess(IJCLCLP),21(2):19-32.[7]DLin.1998.Extractingcollocationsfromtextcorpora.Firstworkshoponcomputationalterminology,1998–Citeseer[8]TomasMikolov,KaiChen,GregCorrado,JeffreyDean.2013.DistributedRepresentationsofWordsandPhrasesandtheirCompositionality[9]D.F.Specht.1991.Ageneralregressionneuralnetwork.IEEETransactionsonNeuralNetworks[10]YoavGoldbergandOmerLevy.2014.word2vecExplained:DerivingMikolovetal.’sNegative-SamplingWord-EmbeddingMethod[11]Seretan,Violeta.2008.Collocationextractionbasedonsyntacticparsing.[12]Seretan,VioletaNerima,LukaWehrli,Eric.2003.Extractionofmulti-wordcollocationsusingsyntacticbigramcomposition.ProceedingsoftheFourthInternationalConferenceonRecentAdvancesinNLP(RANLP-2003)[13]DLin.1998.Usingcollocationstatisticsininformationextraction.SeventhMessageUnderstandingConference(MUC-7)[14]PavelPecina.2005.Anextensiveempiricalstudyofcollocationextractionmethods.ACLstudent'05ProceedingsoftheACLStudentResearchWorkshopPages13-18 電子全文中英文摘要 推文 推薦 評分 引用網址 轉寄         top 相關論文 1. BoostingtheAccuracyofaChineseFactoidQuestionAnsweringSystemwithHybridModulesandLightweightMethods 2. 應用集體推論於生醫全文文獻之實體鏈結與排序 3. 運用醫學相關特徵強化電子病歷中的指代消解 4. SyllableWordSegmentationforMandarinChineseviaDoubleRankingoftheLeftandRightContext 5. 以生物文獻探勘技術辨識蛋白質互動片段之研究 6. 利用深度語意學習加強文件中因果關聯摘要:應用在化合物-疾病-基因路徑 7. 教學輔助對話系統應用於數學文字題 8. 具可解釋性的適性化數學文字題生成系統 9. 詞嵌入增強之統計準則式方法於病例去識別化之應用     簡易查詢 | 進階查詢 | 論文瀏覽 | 熱門排行 | 管理/審核者登入



請為這篇文章評分?