UDICatNCHU/Swinger: 中文情緒分類器 - GitHub
文章推薦指數: 80 %
Running & Testing. Method. load :讀取或是建立情緒分析的模型。
有就會直接讀取 ...
Skiptocontent
{{message}}
UDICatNCHU
/
Swinger
Public
Notifications
Fork
7
Star
34
中文情緒分類器
34
stars
7
forks
Star
Notifications
Code
Issues
1
Pullrequests
0
Actions
Projects
0
Wiki
Security
Insights
More
Code
Issues
Pullrequests
Actions
Projects
Wiki
Security
Insights
UDICatNCHU/Swinger
Thiscommitdoesnotbelongtoanybranchonthisrepository,andmaybelongtoaforkoutsideoftherepository.
master
Branches
Tags
Couldnotloadbranches
Nothingtoshow
{{refName}}
default
Couldnotloadtags
Nothingtoshow
{{refName}}
default
1
branch
1
tag
Code
Latestcommit
Gitstats
25
commits
Files
Permalink
Failedtoloadlatestcommitinformation.
Type
Name
Latestcommitmessage
Committime
Swinger
img
.gitignore
MANIFEST
README.md
setup.cfg
setup.py
spark.py
swinger.py
Viewcode
Swinger
GettingStarted
Prerequisities
Installing
Running&Testing
Method
Model
Run
Unittests
BuiltWith
Contributors
License
Acknowledgments
README.md
Swinger
一個自製的判斷中文情緒的函式庫,因為算出來的機率會在0~1之間搖擺,故命名搖擺者
可透過pip安裝內含已經訓練好的模型
GettingStarted
Prerequisities
OS:Ubuntu/OSXwouldbenice
environment:needpython3sudoapt-getupdate;sudoapt-getinstall;python3python3-dev
Installing
使用虛擬環境Usevirtualenvisrecommended:
virtualenvvenv
啟動方法Howtoactivatevirtualenv
forLinux:.venv/bin/activate
forWindows:venv\Scripts\activate
安裝Install:pipinstallSwinger
Running&Testing
Method
load:讀取或是建立情緒分析的模型。
有就會直接讀取,不會重新建立。
score:計算此模型的areaunderROC本專案因為是二元分類,所以使用這個當作benchmark。
swing:判斷一句話的情緒是正面或反面。
Model
目前提供的分類器有:
LogisticRegression
MultinomialNB
不同情況下準確度會有些差異,但實驗出來的auc都有0.76左右
Run
訓練資料來源:使用我們自製的公開訓練資料->Open-Sentiment-Training-Data
按照Open-Sentiment-Training-Data的README執行
text2json.py會產生出斷好詞的json檔
此格式即為Swinger的inputdata。
訓練資料:PTT黑特版+好人版等等
測試資料:蔡英文粉專
訓練模型:
先準備好訓練資料及測試資料
訓練出指定分類器的模型:
fromSwingerimportSwinger
s=Swinger()
s.load('LogisticRegression',useDefault=False,pos=正面情緒訓練資料,neg=負面情緒訓練資料,BestFeatureVec=選取的特徵數)#以LogisticRegression建立model
s.score(pos_test=正面測試資料,neg_test=負面測試資料)
測試效果:
先準備好要測試的文集
執行下列程式碼:
fromSwingerimportSwinger
s=Swinger()
s.load('LogisticRegression')#或是其他模型例如MultinomialNB
s.swing('齊家治國平天下,小家給治了!國家更需要妳,加油!擇善固執莫在意全家滿意,至於她家謾駡攻許隨她去(正常情緒紓緩),革命尚未成功期盼繼續努力')#結果為pos,正面情緒
Unittests
notyet.
BuiltWith
nltk
sklearn
jieba
numpy
scipy
Contributors
張泰瑋david
黃翔宇
License
ThispackageuseGPL3.0License.
Acknowledgments
About
中文情緒分類器
Resources
Readme
Stars
34
stars
Watchers
5
watching
Forks
7
forks
Releases
1
tags
Packages0
Nopackagespublished
Contributors2
Languages
Python
100.0%
Youcan’tperformthatactionatthistime.
Yousignedinwithanothertaborwindow.Reloadtorefreshyoursession.
Yousignedoutinanothertaborwindow.Reloadtorefreshyoursession.
延伸文章資訊
- 1UDICatNCHU/Swinger: 中文情緒分類器 - GitHub
Running & Testing. Method. load :讀取或是建立情緒分析的模型。有就會直接讀取 ...
- 2Edward1Chou/SentimentAnalysis: 文本情感分析 - GitHub
我们知道,就中文而言,词语的数量就多达数十万,如果给每个词语唯一的编号,那么编号就是从1到几十万变化,变化幅度如此之大,模型的稳定性是很难保证的 ...
- 3中文情感分析- BI-LSTM,文本分类 - GitHub
中文情感分析,CNN,BI-LSTM,文本分类. Contribute to linguishi/chinese_sentiment development by creating an acc...
- 4UDICatNCHU/swingerApp: 情緒分析的django App - GitHub
swingerApp. 一個將Swinger 中文情緒分類器套用到django上的套件. Prerequisities. OS:Ubuntu / OSX would be nice; envir...
- 5sweslo17/chinese_sentiment: 中文情緒分析 - GitHub
中文情緒分析. Contribute to sweslo17/chinese_sentiment development by creating an account on GitHub.