Jieba 中文斷詞簡介

文章推薦指數: 80 %
投票人數:10人

處理中文文本的研究者,常常需要先把中文的連續文字切割成一個個分開的詞彙,這樣才能進一步以軟體工具來處理。

這一工作稱為斷詞、分詞或者切詞。

中文斷詞不容易做得 ... OntoCL 簡介簡介聯繫窗口關於我們 Python電腦還不會講複雜的中文甚麼是程式語言Python簡述Python指令與程式安裝Python為什麼要安裝PythonPython安裝影片Python自學參考資料 初學、自學問題集寫程式與堆積木工具軟體是大型積木最小組合的基本功夫變數的基本觀念比較實用的變數因勢利導見風轉舵逐一篩選與處理基本的檔案讀寫稍進階的檔案操作建立自己的工具 工具軟體軟體工具概述Jieba中文斷詞簡介Jieba安裝Jieba簡測NLTK簡介NLTK安裝 2269天前是OnceUponaTime Jieba中文斷詞簡介 處理中文文本的研究者,常常需要先把中文的連續文字切割成一個個分開的詞彙,這樣才能進一步以軟體工具來處理。

這一工作稱為斷詞、分詞或者切詞。

中文斷詞不容易做得完美,中文敘述的正確斷詞跟語意有密切的關係,有時一句中文可能傳達不同的意思,例如「我的研究生命還有多少年?」至少有下列兩種不同的可能解釋。

我的 研究生命  還有多少年?我的 研究生 命 還有多少年?Jieba是Python環境中非常常被用到的中文斷詞工具。

materialpublishedonthewebsitearesharedunderthetermsof CreativeCommonsAttribution-NonCommercial-ShareAlike4.0InternationalLicense Signin|RecentSiteActivity|ReportAbuse|PrintPage|PoweredByGoogleSites



請為這篇文章評分?