UDICatNCHU/Swinger: 中文情緒分類器 - GitHub

文章推薦指數: 80 %
投票人數:10人

Running & Testing. Method. load :讀取或是建立情緒分析的模型。

有就會直接讀取 ... Skiptocontent {{message}} UDICatNCHU / Swinger Public Notifications Fork 7 Star 34 中文情緒分類器 34 stars 7 forks Star Notifications Code Issues 1 Pullrequests 0 Actions Projects 0 Wiki Security Insights More Code Issues Pullrequests Actions Projects Wiki Security Insights UDICatNCHU/Swinger Thiscommitdoesnotbelongtoanybranchonthisrepository,andmaybelongtoaforkoutsideoftherepository. master Branches Tags Couldnotloadbranches Nothingtoshow {{refName}} default Couldnotloadtags Nothingtoshow {{refName}} default 1 branch 1 tag Code Latestcommit   Gitstats 25 commits Files Permalink Failedtoloadlatestcommitinformation. Type Name Latestcommitmessage Committime Swinger     img     .gitignore     MANIFEST     README.md     setup.cfg     setup.py     spark.py     swinger.py     Viewcode Swinger GettingStarted Prerequisities Installing Running&Testing Method Model Run Unittests BuiltWith Contributors License Acknowledgments README.md Swinger 一個自製的判斷中文情緒的函式庫,因為算出來的機率會在0~1之間搖擺,故命名搖擺者 可透過pip安裝內含已經訓練好的模型 GettingStarted Prerequisities OS:Ubuntu/OSXwouldbenice environment:needpython3sudoapt-getupdate;sudoapt-getinstall;python3python3-dev Installing 使用虛擬環境Usevirtualenvisrecommended: virtualenvvenv 啟動方法Howtoactivatevirtualenv forLinux:.venv/bin/activate forWindows:venv\Scripts\activate 安裝Install:pipinstallSwinger Running&Testing Method load:讀取或是建立情緒分析的模型。

有就會直接讀取,不會重新建立。

score:計算此模型的areaunderROC本專案因為是二元分類,所以使用這個當作benchmark。

swing:判斷一句話的情緒是正面或反面。

Model 目前提供的分類器有: LogisticRegression MultinomialNB 不同情況下準確度會有些差異,但實驗出來的auc都有0.76左右 Run 訓練資料來源:使用我們自製的公開訓練資料->Open-Sentiment-Training-Data 按照Open-Sentiment-Training-Data的README執行 text2json.py會產生出斷好詞的json檔 此格式即為Swinger的inputdata。

訓練資料:PTT黑特版+好人版等等 測試資料:蔡英文粉專 訓練模型: 先準備好訓練資料及測試資料 訓練出指定分類器的模型: fromSwingerimportSwinger s=Swinger() s.load('LogisticRegression',useDefault=False,pos=正面情緒訓練資料,neg=負面情緒訓練資料,BestFeatureVec=選取的特徵數)#以LogisticRegression建立model s.score(pos_test=正面測試資料,neg_test=負面測試資料) 測試效果: 先準備好要測試的文集 執行下列程式碼: fromSwingerimportSwinger s=Swinger() s.load('LogisticRegression')#或是其他模型例如MultinomialNB s.swing('齊家治國平天下,小家給治了!國家更需要妳,加油!擇善固執莫在意全家滿意,至於她家謾駡攻許隨她去(正常情緒紓緩),革命尚未成功期盼繼續努力')#結果為pos,正面情緒 Unittests notyet. BuiltWith nltk sklearn jieba numpy scipy Contributors 張泰瑋david 黃翔宇 License ThispackageuseGPL3.0License. Acknowledgments About 中文情緒分類器 Resources Readme Stars 34 stars Watchers 5 watching Forks 7 forks Releases 1 tags Packages0 Nopackagespublished Contributors2     Languages Python 100.0% Youcan’tperformthatactionatthistime. Yousignedinwithanothertaborwindow.Reloadtorefreshyoursession. Yousignedoutinanothertaborwindow.Reloadtorefreshyoursession.



請為這篇文章評分?