中文情感分析语料库大全-带下载地址 - DataSense

文章推薦指數: 80 %
投票人數:10人

中文的带有情感标注的语料库比较少, 所以我特地整理了一些公开的语料库, 有些怕丢失, 放到了自己的百度网盘里, 有需要的请自行下载。

Home Archives About Tags Categories Contact SPSS+AMOS数据分析案例教程-关于中介模 SPSS视频教程内容目录和跳转链接 中文情感分析语料库大全-带下载地址 微博@mlln-cn,并附上文章url链接,我就能回答你的问题奥! 2018年10月11日 中文的带有情感标注的语料库比较少,所以我特地整理了一些公开的语料库,有些怕丢失,放到了自己的百度网盘里,有需要的请自行下载。

中文对话情绪语料sentiment_XS_test.txt包含11577个手动标记的实例(文中提到的XS_test)。

sentiment_XS_30k.txt包含几乎30k个自动标记的实例(文中提到的XS_30k)。

所有数据均来自人机对话日志,并由Jieba工具进行分词。

如果你使用这个数据集,请参阅第12届计算智能与安全国际会议(CIS2016),论文:卷积神经网络的情感分类:大规模中文会话语料库的实验研究。

下载地址:https://github.com/xxxspy/Chinese_conversation_sentiment 中文微博情感分析测评数据说明:数据来自腾讯微博1。

评测数据全集包括20个话题,每个话题采集大约1000条微博,共约20000条微博。

数据采用xml格式,已经预先切分好句子。

每条句子的所有标注信息都包含在元素的属性中。

其中opinionated表示是否观点句,polarity表示句子情感倾向。

下载地址:https://pan.baidu.com/s/1psjysSXpKOEb1ciem7DsRw密码:7hb4 中文情感词汇本体中文情感词汇本体库是大连理工大学信息检索研究室在林鸿飞教授的指导下经过全体教研室成员的努力整理和标注的一个中文本体资源。

该资源从不同角度描述一个中文词汇或者短语,包括词语词性种类、情感类别、情感强度及极性等信息。

中文情感词汇本体的情感分类体系是在国外比较有影响的Ekman的6大类情感分类体系的基础上构建的。

在Ekman的基础上,词汇本体加入情感类别“好”对褒义情感进行了更细致的划分。

最终词汇本体中的情感共分为7大类21小类。

构造该资源的宗旨是在情感计算领域,为中文文本情感分析和倾向性分析提供一个便捷可靠的辅助手段。

中文情感词汇本体可以用于解决多类别情感分类的问题,同时也可以用于解决一般的倾向性分析的问题。

本体格式介绍 情感词汇本体中,一般的格式为。

表1情感词汇本体格式举例词语词性种类词义数词义序号情感分类强度极性辅助情感分类强度极性无所畏惧idiom11PH71手头紧idiom11NE70周到adj11PH51言过其实idiom11NN52 其中,一个情感词可能对应多个情感,情感分类用于刻画情感词的主要情感分类,辅助情感为该情感词在具有主要情感分类的同时含有的其他情感分类。

情感分类及情感强度 情感分类按照论文《情感词汇本体的构造》所述,情感分为7大类21小类。

情感强度分为1,3,5,7,9五档,9表示强度最大,1为强度最小。

情感分类如表2所示:表2情感分类编号情感大类情感类例词1乐快乐(PA)喜悦、欢喜、笑眯眯、欢天喜地2安心(PE)踏实、宽心、定心丸、问心无愧3好尊敬(PD)恭敬、敬爱、毕恭毕敬、肃然起敬4赞扬(PH)英俊、优秀、通情达理、实事求是5相信(PG)信任、信赖、可靠、毋庸置疑6喜爱(PB)倾慕、宝贝、一见钟情、爱不释手 7祝愿(PK)渴望、保佑、福寿绵长、万寿无疆8怒愤怒(NA)气愤、恼火、大发雷霆、七窍生烟9哀悲伤(NB)忧伤、悲苦、心如刀割、悲痛欲绝10失望(NJ)憾事、绝望、灰心丧气、心灰意冷11疚(NH)内疚、忏悔、过意不去、问心有愧12思(PF)思念、相思、牵肠挂肚、朝思暮想13惧慌(NI)慌张、心慌、不知所措、手忙脚乱14恐惧(NC)胆怯、害怕、担惊受怕、胆颤心惊15羞(NG)害羞、害臊、面红耳赤、无地自容16恶烦闷(NE)憋闷、烦躁、心烦意乱、自寻烦恼17憎恶(ND)反感、可耻、恨之入骨、深恶痛绝18贬责(NN)呆板、虚荣、杂乱无章、心狠手辣19妒忌(NK)眼红、吃醋、醋坛子、嫉贤妒能20怀疑(NL)多心、生疑、将信将疑、疑神疑鬼21惊惊奇(PC)奇怪、奇迹、大吃一惊、瞠目结舌 词性种类 情感词汇本体中的词性种类一共分为7类,分别是名词(noun),动词(verb),形容词(adj),副词(adv),网络词语(nw),成语(idiom),介词短语(prep)。

极性标注 每个词在每一类情感下都对应了一个极性。

其中,0代表中性,1代表褒义,2代表贬义,3代表兼有褒贬两性。

注:褒贬标注时,通过词本身和情感共同确定,所以有些情感在一些词中可能极性1,而其他的词中有可能极性为0。

存储格式及规模 中文情感本体以excel的格式进行存储,共含有情感词共计27466个,文件大小为1.22M。

下载地址:https://pan.baidu.com/s/1jTw3F-Zme2ekspQUUsCiNQ密码:py1q修改版下载地址:https://figshare.com/articles/___/6881282/1 中文褒贬义词词典下载链接:https://pan.baidu.com/s/1RzqIGwrE023PmnEZGFszHg密码:hu1h 商品评论情感语料库中文情感分析语料库,包含酒店、服装、水果、平板、洗发水等5个领域的评价数据,每个领域各包含5000条正面和负面评价,数据抓取于携程网和京东,仅供科研学习之用,欢迎下载使用! 下载地址:https://pan.baidu.com/s/1_9sGJFD29gssC9ZrQaMa7A密码:h5hf 关注本页,未完待续我们逐渐补充更多的中文情感分析语料库,希望对大家的研究有所帮助,如果有特殊需求,如网络数据抓取可以联系我。

#情感分析#语料库 赞助 持续创造有价值的内容,我需要你的帮助 赞助推荐 问卷代填保证质量 问卷代填100%好评 数据分析代做 论文查重 问卷派发质量保证的 问卷代填乱填可补 论文查重优惠大 论文查重入口 论文查重100%好评 论文查用 文章写作 论文代写淘宝担保 数据分析咨询入口 程序开发代做 常用工具 Mplus结果查看器 绘图软件 在线绘制中介效应图 神经网络可视化 psychopy教程 [词向量]高维向量可视化 [tensorflow.js案例]进化算法演示 [书]Python最佳实践 Sobel检验计算器 平均方差提取量AVE和组合信度CR计算器 卡方检验计算器 简单交互效应可视化工具 P值显著性计算器 两组均值差异的效应量在线计算器 Python数据科学技术交流QQ群:116384132 SPSS/Stata统计分析QQ群:572803384 如果你有其他有价值的群,想放到这里分享,可以联系我QQ675495787 情感分析 sentimentpy模块进行中文文本情感分类 中文情感分析语料库大全-带下载地址 Python数据科学技术交流QQ群:116384132 SPSS/Stata统计分析QQ群:572803384 如果你有其他有价值的群,想放到这里分享,可以联系我QQ675495787 语料库 中文情感分析语料库大全-带下载地址 自然语言处理停用词大全-百度-哈工大-四川大学 机器翻译语料库大全(免费下) (译)吊炸天的中文自然语言处理工具和语料库介绍 中文语料库构建过程详细教程 友商赞助 问卷大全问卷案例下载 大学生互填问卷群推荐



請為這篇文章評分?