wordnet python处理中文与英文 - CSDN博客

文章推薦指數: 80 %
投票人數:10人

wordnet python处理中文与英文 · print( wn.synset('apple.n.01').definition()) · fruit with red or yellow or green skin and sweet to tart crisp ... wordnetpython处理中文与英文 pursue_Crazy_NLP 于 2018-06-0911:21:03 发布 6497 收藏 13 分类专栏: NLP 文章标签: Python Wordnet 中文 NLP 同义词 版权声明:本文为博主原创文章,遵循CC4.0BY-SA版权协议,转载请附上原文出处链接和本声明。

本文链接:https://blog.csdn.net/Pursue_MyHeart/article/details/80631278 版权 NLP 专栏收录该内容 4篇文章 2订阅 订阅专栏 一、英文 1.安装nltk,导入Wordnet, Python版本3.5 fromnltk.corpusimportwordnetaswn 2.同义词集的定义  car.n.01是car的一个名词意义,被称之为同义词集,也就是意义相同的词(或词条)的集合。

这里的’dog.n.01’指:dog的第一个名词意思;’chase.v.01’指:chase的第一个动词意思,后面我们可以用definition()这个对同义词集进行解释: print(wn.synset('apple.n.01').definition()) fruitwithredoryelloworgreenskinandsweettotartcrispwhitishflesh 3.查找同义词集的所有词 print(wn.synset('car.n.01').lemma_names()) ['car','auto','automobile','machine','motorcar'] 4.进行造句 print(wn.synset('dog.n.01').examples()) ['thedogbarkedallnight'] 5.同义词查询 forsynsetinwn.synsets('car'): print(synset.lemma_names()) ['car','auto','automobile','machine','motorcar'] ['car','railcar','railway_car','railroad_car'] ['car','gondola'] ['car','elevator_car'] ['cable_car','car'] 下位词 下位词(hyponym),指概念上内涵更窄的主题词。

 例如:”鲜花速递”的下位词包括”上海鲜花速递” 、”深圳鲜花速递”、 ”网上鲜花速递”,”笨小孩”是”歌”的下位词,”笨小孩”是”刘德华”的下位词。

 ++ 下位词是相对某主题词的,也有它自己的等同词、上位词、下位词、同类词。

  motorcar=wn.synset('car.n.01') types_of_motorcar=motorcar.hyponyms() print(sorted([lemma.name()forsynsetintypes_of_motorcarforlemmainsynset.lemmas()])) ['Model_T','S.U.V.','SUV','Stanley_Steamer','ambulance','beach_waggon','beach_wagon','bus','cab','compact','compact_car','convertible','coupe','cruiser','electric','electric_automobile','electric_car','estate_car','gas_guzzler','hack','hardtop','hatchback','heap','horseless_carriage','hot-rod','hot_rod','jalopy','jeep','landrover','limo','limousine','loaner','minicar','minivan','pace_car','patrol_car','phaeton','police_car','police_cruiser','prowl_car','race_car','racer','racing_car','roadster','runabout','saloon','secondhand_car','sedan','sport_car','sport_utility','sport_utility_vehicle','sports_car','squad_car','station_waggon','station_wagon','stock_car','subcompact','subcompact_car','taxi','taxicab','tourer','touring_car','two-seater','used-car','waggon','wagon'] 6.利用词条查询反义词 good=wn.synset('good.a.01') print(good.lemmas()[0].antonyms()) [Lemma('bad.a.01.bad')] 7.查询synonymsandantonyms forsyninwordnet.synsets("good"): forlinsyn.lemmas(): synonyms.append(l.name()) ifl.antonyms(): antonyms.append(l.antonyms()[0].name()) print(set(synonyms)) print(set(antonyms)) {'proficient','trade_good','expert','skilful','salutary','dear','commodity','goodness','respectable','right','undecomposed','just','serious','skillful','ripe','honorable','effective','secure','well','in_effect','soundly','dependable','in_force','estimable','unspoilt','adept','thoroughly','honest','full','beneficial','upright','practiced','safe','good','unspoiled','sound','near'} {'badness','evilness','evil','bad','ill'} 二、中文 1.查询同义词 forsynsetinwn.synsets(u'计算机',lang='cmn'): types_of_computer=synset.hyponyms() print(sorted([lemma.name()forsynsetintypes_of_computerforlemmainsynset.lemmas('cmn')])) ['便携式计算器','加数器','加法器','加法器','加法机','加法计算器','手摇计算器','算术计算机','算盘','计数器','计算机'] ['家用电脑','家用计算机','数字计算机','模拟计算机','网站','网络站点'] forsynsetinwn.synsets(u'计算机',lang='cmn'): forlemmainsynset.lemma_names('cmn'): print(lemma) 加数器 加法器 加法机 加法计算器 算术计算机 计算机 计算器 计算机 电子计算机 电脑 计算机 2.利用中文查找同义词的英文 print(wn.lemmas(u'选择',lang='cmn')) [Lemma('choose.v.01.选择'),Lemma('elect.v.02.选择'),Lemma('pick.v.02.选择'),Lemma('option.n.02.选择'),Lemma('selection.n.02.选择')] 3.中文的两个词相似度的查找 select=wn.synsets(u'选择',lang='cmn')[0] selectn3=wn.synsets(u'找出',lang='cmn')[0] print(select.path_similarity(selectn3)) 0.25 参考文献: 1.https://blog.csdn.net/huxuanlai/article/details/62894413 2.https://blog.csdn.net/pearyangyang/article/details/70208863 3.https://blog.csdn.net/King_John/article/details/80252594 开发者涨薪指南 48位大咖的思考法则、工作方式、逻辑体系 pursue_Crazy_NLP 关注 关注 7 点赞 踩 6 评论 13 收藏 打赏 扫一扫,分享内容 点击复制链接 专栏目录 评论 6 您还未登录,请先 登录 后发表或查看评论 相关推荐 下载 中文版wordnet 07-02 以前做项目时看过个,可惜后来还是没怎么用上。

从官网上下载的,只有32个表,好像内容并不全。

献给有需要的人。

博客 知识图谱之WordNet 热门推荐 谢彦的技术博客 09-02 1万+ 1.说明  今天讨论的是自然语言中的知识抽取和知识表示,换言之,就是如何从大量的书籍文献中剥离出我们关心的所谓“知识”,并将起组织保存成简单可用的描述。

 不同的知识类型需要采用不同的知识表示方式,温有奎教授总结了10种知识类型(具体见参考部分)。

对于静态概念及概念之间关系用面向对象形式来表示,对命题型问题用一阶逻辑来表示,对于系统流程和实验流程等过程性知识用脚本表示法。

 静态概念是... 博客 pythonWordNet的使用方法(整理版) King_John的专栏 05-09 1万+ wordNet的安装和使用 博客 pythonwordnet常用方法使用 、Edgar的博客 03-19 960 wordnet包的使用 下载nltk包,运行下方代码 importnltk nltk.download() 在corpora中选择wordnet相关包下载 导入包 fromnltk.corpusimportwordnetaswn 查找一个词所在的所有词集 wn.synsets('cat') #可以指定所需要词集的形式 wn.synsets('cats',pos=w... 博客 《中英文在自然语言处理上的十大差异点》学习总结 weixin_36711901的博客 04-08 2224 中英文在自然语言处理上的十大差异点 ——学习总结 原文链接→https://mp.weixin.qq.com/s/C7AF7ECj0bF5G1kDo3V72w 自然语言是人与人交流沟通的重要媒介和方式,经历过漫长的历史发展,在世界各地形成了众多的语言分支。

语言就像一个加过密的通讯系统一样,只有发送和接受两端有一致的加密规则,双方才能进行有效通讯。

语言不通主要是因为不同类型的语言有不同表达... 博客 中文WordNet的安装与使用 春天 06-28 1361 最近在中文语料上数据分析,想借用一些外部资源,就想到了WordNet,在这里记录一下,以备后用。

文章目录(一)WordNet的介绍(二)WordNet的安装(三)中英文WordNet的使用(1)词义查询(2)同义词查询(3)其他查询 (一)WordNet的介绍 WordNet是由Princeton大学的心理学家,语言学家和计算机工程师联合设计的一种基于认知语言学的英语词典。

它不是光把单词以字母顺序排列,而且按照单词的意义组成一个“单词的网络”。

它是一个覆盖范围宽广的英语词汇语义网。

名词,动词,形容 博客 用WordNet实现中文情感分析 谢彦的技术博客 03-14 1万+ 用WordNet实现中文情感分析 博客 Python使用wordnet工具计算词集与词条基本用法(一) 最新发布 呆萌的代Ma 08-05 168 wordnet源文件下载地址:https://wordnet.princeton.edu/download/current-version 要把wordnet当做工具使,首先要导入包: fromnltk.corpusimportwordnetaswn 在wordnet中的标识: 形容词(adj):a 副词(adv):r 名词(n):n 动词(v):v 基本用法 参考文档 WordNet:https://wordnet.princeton.edu/ Language:https://ww 博客 Python自然语言处理(基于jieba分词和NLTK) Xy-Huang的博客 05-11 1万+ 欢迎加入学习交流QQ群:657341423 自然语言处理是人工智能的类别之一。

自然语言处理主要有那些功能?我们以百度AI为例 从上述的例子可以看到,自然语言处理最基本的功能是词法分析,词法分析的功能主要有: 分词分句 词语标注 词法时态(适用于英文词语) 关键词提前(词干提取) 由于英文和中文在文化上存在巨大的差异,因此Python处理英文和中文需要使用不同的模块,中文处... 博客 NLTK库WordNet的使用方法实例 weixin_30478923的博客 04-11 384 1、在代码中引入wordnet包 >>>fromnltk.corpusimportwordnetaswn 2、查询一个词所在的所有词集(synsets) >>>wn.synsets('dog') [Synset('dog.n.01'),Synset('frump.n.01'), Synset('f... 博客 中文情感分析实例---WordNet 不朽的博客 02-27 1658 1.安装nltk   pipinstallnltk 2.下载文本到本地 ----wordnet汉语开放词网,可从以下网址下载:http://compling.hss.ntu.edu.sg/cow/ ----停用词:参考以下网页,另外加入常用标点符号http://blog.csdn.net/u010533386/article/details/51458591 3.下载WordNet... 博客 WordNet、FrameNet同义词及相关词汇查询 qq_36771895的博客 06-23 2317 WordNet、FrameNet同义词及相关词汇查询 WordNet、FrameNet相关PythonAPI使用,请参考链接: WordNetPythonAPI(整理总结) FrameNet&FrameNetPythonAPI(整理总结) FrameNet """ 通过FrameNet获取相应关键词的相关词汇的四种方法 """ importre fromnl... 博客 使用wordnet找出同义词,并给出对应释义 LawsonAbs'sSpiritualHome 12-09 569 使用wordnet找出同义词并给出相应释义 博客 python有点_python与中文的那点事 weixin_36304352的博客 01-29 23 python与中文的那点事在学习python的过程中,发现在python2与python3中对中文的处理有所不同,所以这篇文章就来探讨一下这些不同1.utf-8/gbk/unicode/ASCII我们都知道,在计算机内部所有的信息都可以被表示成二进制的字符串,每一个二进制位有1和0两种状态,因此8位的二进制数可以表示256种状态,这也被称为字节(byte),也就是一个字节可以表示可以用来表示25... 博客 python语言基本语句例句-关于python:使用WordNet查找同义词,定义和例句 weixin_39647787的博客 11-11 148 我需要输入一个单词的输入文本文件。

然后,我需要使用wordnet查找lemma_names,单词的同义词集的定义和示例。

我读过这本书:"使用NLTK2.0食谱进行Python文本处理"和"使用NLTK进行自然语言处理",以帮助我朝这个方向发展。

尽管我已经知道可以使用终端来完成此操作,但是我无法使用文本编辑器来完成此操作。

例如,如果输入文本具有单词&quot... 博客 Python自然语言处理笔记(二)nltk实践记录 席八 04-25 1402 nltk的安装 installnltk nltk.download() 报错 [nltk_data]Errorloadingwordnet: nltk.download()报错getaddrinfofailed 参考解决NLTK语料库下载出错及n... 博客 WordNet简介 weixin_34050427的博客 04-08 414 WordNet 1WordNet简介  传统词典一般都是按字母顺序组织词条信息的,这样的词典在解决用词和选义问题上是有价值的。

然而,它们有一个共同的缺陷,就是忽略了词典中同义信息的组织问题。

20世纪以来,语言学家和心理学家们开始从一个崭新的角度来探索现代语言学知识结构以及特定的词典结构,终于由Princeton大学研制成功了一个联机英语词汇检索系统—WordNet,它作为语言学本体库,同时又... 博客 python汉字同义词替换_用WordNet和NLTK-python替换语料库中的同义词 weixin_39731107的博客 12-15 451 尝试编写简单的python脚本,该脚本将使用NLTK查找和替换txt文件中的同义词。

以下代码给出错误:Traceback(mostrecentcalllast):File"C:\Users\Nedim\Documents\sinon2.py",line21,inchange(word)File"C:\Users\Nedim\Documents\sinon2.py",line... “相关推荐”对你有帮助么? 非常没帮助 没帮助 一般 有帮助 非常有帮助 提交 ©️2022CSDN 皮肤主题:编程工作室 设计师:CSDN官方博客 返回首页 pursue_Crazy_NLP CSDN认证博客专家 CSDN认证企业博客 码龄6年 暂无认证 13 原创 21万+ 周排名 105万+ 总排名 4万+ 访问 等级 588 积分 8 粉丝 31 获赞 13 评论 60 收藏 私信 关注 热门文章 在cmd下输入sqlplus,提示找不到文件 9948 tensorboard'不是内部或外部命令,也不是可运行的程序或批处理文件。

6506 wordnetpython处理中文与英文 6492 KerasLSTM对20Newsgroups数据集进行分类 4093 LSTM情感分类 3905 分类专栏 NLP 4篇 python 1篇 Java算法 2篇 Java基础 1篇 Oracle 2篇 J2EE 1篇 php 1篇 tensorflow 1篇 最新评论 wordnetpython处理中文与英文 toefl不到100不改名: 请问中文反义词怎么得到? tensorboard'不是内部或外部命令,也不是可运行的程序或批处理文件。

mendf: 同问,我没有这个文件要怎么办啊? wordnetpython处理中文与英文 不抛弃王一博不放弃李汶翰: 太感谢你了,我昨天找了一晚上中文上位词提取没找到,今天看到你这篇文章了,对我非常有帮助,谢谢你! wordnetpython处理中文与英文 qq_40693124: 你好,请问中文反义词怎么查询呀 KerasLSTM对20Newsgroups数据集进行分类 qq_40621148: 博主请问如果我只想使用全连接层,不适用LSTM和embedding层,该如何修改这个模型代码呢 您愿意向朋友推荐“博客详情页”吗? 强烈不推荐 不推荐 一般般 推荐 强烈推荐 提交 最新文章 tensorboard'不是内部或外部命令,也不是可运行的程序或批处理文件。

KerasLSTM对20Newsgroups数据集进行分类 LSTM情感分类 2018年6篇 2016年6篇 2015年1篇 目录 目录 分类专栏 NLP 4篇 python 1篇 Java算法 2篇 Java基础 1篇 Oracle 2篇 J2EE 1篇 php 1篇 tensorflow 1篇 目录 打赏作者 pursue_Crazy_NLP 你的鼓励将是我创作的最大动力 ¥2 ¥4 ¥6 ¥10 ¥20 输入1-500的整数 余额支付 (余额:--) 扫码支付 扫码支付:¥2 获取中 扫码支付 您的余额不足,请更换扫码支付或充值 打赏作者 实付元 使用余额支付 点击重新获取 扫码支付 钱包余额 0 抵扣说明: 1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。

2.余额无法直接购买下载,可以购买VIP、C币套餐、付费专栏及课程。

余额充值



請為這篇文章評分?