中文WordNet的安装与使用__春天 - CSDN博客
文章推薦指數: 80 %
具体调用过程与词义查询基本一致。
英文. from nltk.corpus import wordnet as wn # 方法一: print ...
中文WordNet的安装与使用
_春天_
于 2021-06-2819:44:36 发布
1360
收藏
9
分类专栏:
机器学习
文章标签:
python
wordnet
机器学习
版权声明:本文为博主原创文章,遵循CC4.0BY-SA版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/weixin_42294274/article/details/118309645
版权
机器学习
专栏收录该内容
10篇文章
0订阅
订阅专栏
最近在中文语料上数据分析,想借用一些外部资源,就想到了WordNet,在这里记录一下,以备后用。
文章目录
(一)WordNet的介绍(二)WordNet的安装(三)中英文WordNet的使用(1)词义查询(2)同义词查询(3)其他查询
(一)WordNet的介绍
WordNet是由Princeton大学的心理学家,语言学家和计算机工程师联合设计的一种基于认知语言学的英语词典。
它不是光把单词以字母顺序排列,而且按照单词的意义组成一个“单词的网络”。
它是一个覆盖范围宽广的英语词汇语义网。
名词,动词,形容词和副词各自被组织成一个同义词的网络,每个同义词集合都代表一个基本的语义概念,并且这些集合之间也由各种关系连接。
WordNet包含描述概念含义,一义多词,一词多义,类别归属,近义,反义等问题,访问以下网页,可使用wordnet的基本功能:http://wordnetweb.princeton.edu/perl/webwn
(二)WordNet的安装
首先要安装nltk.
pipinstallnltk
然后用nltk的downloader下载“wordnet”,获取相关的数据。
importnltk
nltk.download('wordnet')#这是英文的wordnet
如果要使用中文的WordNet,需要再下载一个组件“omw”。
nltk.download('omw')#omw代表OpenMultilingualWordnet
安装好以后,就可以使用啦。
(三)中英文WordNet的使用
(1)词义查询
word.definition()
英文
fromnltk.corpusimportwordnetaswn
#获得单个词的定义查询
apple=wn.synset('apple.n.01')
print(apple.definition())
#获得该词的所有词性及解释下的定义
word='apple'
forwinwn.synsets(word):
print(w.definition())
#输出:
#fruitwithredoryelloworgreenskinandsweettotartcrispwhitishflesh
#fruitwithredoryelloworgreenskinandsweettotartcrispwhitishflesh
#nativeEurasiantreewidelycultivatedinmanyvarietiesforitsfirmroundedediblefruits
中文
因为中文在查询时,本质上还是映射到英文语义上去,所以不能直接用类似“秘密.n.01”这种形式,只用用synsets来查,synset是没有‘lang’这个参数的。
word='秘密'
print('originword:',word)
iflen(wn.synsets(word,lang='cmn'))==0:
print('Nothisword')
forwinwn.synsets(word,lang='cmn'):
print(w)
print(w.definition())
#输出:
#originword:秘密
#Synset('mystery.n.01')
#somethingthatbafflesunderstandingandcannotbeexplained
#Synset('secret.n.01')
#somethingthatshouldremainhiddenfromothers(especiallyinformationthatisnottobepassedon)
#Synset('privacy.n.02')
#theconditionofbeingconcealedorhidden
一些注释
一个词可能同时具有动词、名词等多种词性,而且每个词性下可能具有多种解释。
例如,在查询"privacy"一词时:
“privacy.n.01”代表“thequalityofbeingsecludedfromthepresenceorviewofothers”,"privacy.n.02"代表“theconditionofbeingcncealedorhidden”
n代表名词,v代表动词,数字代表第几个。
`
(2)同义词查询
word.lemma_names()
具体调用过程与词义查询基本一致。
英文
fromnltk.corpusimportwordnetaswn
#方法一:
print(wn.synset('apple.n.01').lemma_names())
#方法二:
forwinwn.synsets('apple'):
print(w.lemma_names())
中文
word='秘密'
forwinwn.synsets(word,lang='cmn'):
print(w.lemma_names())
#输出
#['privacy','privateness','secrecy','concealment']
#['mystery','enigma','secret','closed_book']
#['mystery','enigma','secret','closed_book']
这里相当于是,把中文的“秘密”与英文中的词做了一个对应,对应到三个名词,分别是上面提到的’mystery.n.01’,‘secret.n.01’和‘privacy.n.02’。
在找同义词时,分别找到了“秘密”这个中文词对应的三个英文词的同义词。
(3)其他查询
hypernyms()#上位(父类)
hyponyms()#下位(子类)
lemma_names()#同义
antonyms()#反义
entailments()#蕴含关系
part_meronyms()#部分
substance_meronyms()#实质
member_holonyms()#成员
目前只用到了同位词,以后用到什么其他的模块,再来补充吧。
参考:https://blog.csdn.net/xieyan0811/article/details/82314042https://blog.csdn.net/MAILLIBIN/article/details/100580676
_春天_
关注
关注
3
点赞
踩
0
评论
9
收藏
打赏
扫一扫,分享内容
点击复制链接
专栏目录
中文版wordnet
07-02
以前做项目时看过个,可惜后来还是没怎么用上。
从官网上下载的,只有32个表,好像内容并不全。
献给有需要的人。
NLTKwordnet.zip
12-01
id:wordnet;size:10775600;author:;copyright:WordNet3.0Copyright2006byPrincetonUniversity.Allrightsreserved.;license:Permissiontouse,copy,modifyanddistributethissoftwareanddatabaseanditsdocumentationforanypurposeandwithoutfeeorroyaltyisherebygranted,providedthatyouagreetocomplywiththefollowingcopyrightnoticeandstatements,includingthedisclaimer,andthatthesameappearonALLcopiesofthesoftware,databaseanddocumentation,includingmodificationsthatyoumakeforinternaluseorfordistribution....[seewebpageforfulllicense];
参与评论
您还未登录,请先
登录
后发表或查看评论
词语相似度计算:1、安装NLTK和下载WordNet语料库;WordNet的使用
mmc2015的专栏
03-21
1万+
NLTK在anaconda中有,WordNet语料库需要手动下载。
这里主要介绍如何下载wordnet语料库。
。
。
In[1]:fromnltk.corpusimportwordnetaswn
In[2]:wn.syssets('love')
Traceback(mostrecentcalllast):
File"",line1,in
WordNet介绍和使用
热门推荐
计算所信息抽取小组专栏
03-20
4万+
Wordnet是一个词典。
每个词语(word)可能有多个不同的语义,对应不同的sense。
而每个不同的语义(sense)又可能对应多个词,如topic和subject在某些情况下是同义的,一个sense中的多个消除了多义性的词语叫做lemma。
例如,“publish”是一个word,它可能有多个sense:1.(39)print,publish--(putintoprint
pythonWordNet的使用方法(整理版)
King_John的专栏
05-09
1万+
wordNet的安装和使用
WordNet简介
weixin_34050427的博客
04-08
414
WordNet
1WordNet简介
传统词典一般都是按字母顺序组织词条信息的,这样的词典在解决用词和选义问题上是有价值的。
然而,它们有一个共同的缺陷,就是忽略了词典中同义信息的组织问题。
20世纪以来,语言学家和心理学家们开始从一个崭新的角度来探索现代语言学知识结构以及特定的词典结构,终于由Princeton大学研制成功了一个联机英语词汇检索系统—WordNet,它作为语言学本体库,同时又...
快速了解WordNet
最新发布
子燕若水的博客
09-22
463
1、什么是WordNet
WordNet是由Princeton大学的心理学家,语言学家和计算机工程师联合设计的一种基于认知语言学的英语词典。
它不是光把单词以字母顺序排列,而且按照单词的意义组成一个“单词的网络”。
WordNet是一个覆盖范围宽广的英语词汇语义网。
名词,动词,形容词和副词各自被组织成一个同义词的网络,每个同义词集合都代表一个基本的语义概念,并且这些集合之间也由各种关系连接。
Wordnet的词汇结构包括九大类:上下位关系(动词、名词)、蕴含关系(动词)、相似关系(名词)、成员部分关..
知识图谱之WordNet
谢彦的技术博客
09-02
1万+
1.说明
今天讨论的是自然语言中的知识抽取和知识表示,换言之,就是如何从大量的书籍文献中剥离出我们关心的所谓“知识”,并将起组织保存成简单可用的描述。
不同的知识类型需要采用不同的知识表示方式,温有奎教授总结了10种知识类型(具体见参考部分)。
对于静态概念及概念之间关系用面向对象形式来表示,对命题型问题用一阶逻辑来表示,对于系统流程和实验流程等过程性知识用脚本表示法。
静态概念是...
用WordNet实现中文情感分析
谢彦的技术博客
03-14
1万+
用WordNet实现中文情感分析
WordNet介绍
weixin_43963453的博客
09-25
705
WordNet介绍
中文情感分析实例---WordNet
不朽的博客
02-27
1658
1.安装nltk
pipinstallnltk
2.下载文本到本地
----wordnet汉语开放词网,可从以下网址下载:http://compling.hss.ntu.edu.sg/cow/
----停用词:参考以下网页,另外加入常用标点符号http://blog.csdn.net/u010533386/article/details/51458591
3.下载WordNet...
wordnet的中文支持项目openmultilingualwordnet分析试用
建模分析师胡选来
03-17
2686
主要关注中文的对应英文,一词多义,多词同义,词相似度功能。
#下载openmultilingualwordnet语料
importnltk
nltk.download("wordnet")
nltk.download("wordnet_ic")
nltk.download('omw')
fromnltk.corpusimportwordnetaswn
#wor
wordnet-lmf:WordNet词法标记框架(LMF)
05-29
WordNet-LMF
WordNet词法标记框架(LMF)
关于
这是一个命令行接口(CLI)和底层应用程序编程接口(API),用于解析格式文件并将数据导入紧凑的SQLite数据库文件。
这种方法的动机是:一个100MB的LMFXML消耗大约1GB的RAM(由于XMLDOM)并且查询速度非常慢,而相应的SQLite数据库文件只是LMFXML文件大小的20%左右,并且可以非常快速地查询并且消耗无害的RAM。
此NPM模块仅附带用于处理LMFXML文件的LMFCLI和API,不附带任何特定的LMFXML文件。
请参阅LMFXML/SQLite格式的英语和德语WordNet的配套模块和。
资料模型
基于DTD,我们派生并记录了我们在此NPM模块中使用的。
链接
安装
$npminstall
WordNet的使用
LawsonAbs'sSpiritualHome
11-14
428
简要介绍如何使用wordNet
wordnetpython处理中文与英文
Pursue_MyHeart的博客
06-09
6497
一、英文1.安装nltk,导入Wordnet,Python版本3.5fromnltk.corpusimportwordnetaswn2.同义词集的定义 car.n.01是car的一个名词意义,被称之为同义词集,也就是意义相同的词(或词条)的集合。
这里的’dog.n.01’指:dog的第一个名词意思;’chase.v.01’指:chase的第一个动词意思,后面我们可以用definitio...
Python使用wordnet工具计算词集与词条基本用法(一)
呆萌的代Ma
08-05
168
wordnet源文件下载地址:https://wordnet.princeton.edu/download/current-version
要把wordnet当做工具使,首先要导入包:
fromnltk.corpusimportwordnetaswn
在wordnet中的标识:
形容词(adj):a
副词(adv):r
名词(n):n
动词(v):v
基本用法
参考文档
WordNet:https://wordnet.princeton.edu/
Language:https://ww
python常用单词有多少_python–NLTK每个单词最常见的同义词(Wordnet)
weixin_39855869的博客
11-23
73
同义词很棘手,但是如果你开始使用Wordnet的synset并且你只想选择集合中最常见的成员,那么它非常简单:只需从语料库中构建自己的频率列表,然后查找每个成员.synset选择最大值.nltk将让您只需几行代码即可构建频率表.这是基于布朗语料库的一个:fromnltk.corpusimportbrownfreqs=nltk.FreqDist(w.lower()forwinbr...
WordNet使用方法
~菜鸟学飞~的专栏
12-18
3995
在WordNet中有词语的各种信息,定义、同义、上位、下位、实例、包含等等关系的词集,通过调用相应方法可一一获取,然后进行同义词计算、类别划分等操作。
源码的main()函数在wn.c文件中。
注意:若在windows环境下调用,则需要在wn.h和wnutil.c文件首行添加 #define_WINDOWS123宏定义,否则编译报错。
//printthesynsetandhype
“相关推荐”对你有帮助么?
非常没帮助
没帮助
一般
有帮助
非常有帮助
提交
©️2022CSDN
皮肤主题:大白
设计师:CSDN官方博客
返回首页
_春天_
CSDN认证博客专家
CSDN认证企业博客
码龄4年
暂无认证
36
原创
89万+
周排名
6万+
总排名
3万+
访问
等级
479
积分
13
粉丝
30
获赞
16
评论
59
收藏
私信
关注
热门文章
【论文阅读-对比学习】ConSERT-AContrastiveFrameworkforSelf-SupervisedSentenceRepresentationTransfer
3848
pandas用read_csv读取txt文件时,部分行丢失
3705
matplotlib画图——y轴不均匀/不等距刻度、对数刻度图
2835
【书籍阅读】-人在回路机器学习Human-in-the-LoopMachineLearning(一)
2750
Latex打勾打叉
2386
分类专栏
论文阅读
13篇
对比学习
4篇
ICD自动编码
3篇
机器学习
10篇
Python
4篇
Leetcode
2篇
错题本
4篇
工具箱
8篇
最新评论
Latex带圈的序号
醉陶然315:
特别感谢你的分享,很清楚
Latex打勾打叉
xuzheng00:
帮忙了/抱拳
论文翻译|疾病自动编码|Clinical-Coder:AssigningInterpretableICD-10CodestoChineseClinicalNotes
weixin_45344171:
请问可以复现该论文代码吗
python爬虫获取维基百科词条
_春天_:
自己爬就行,不用买吧
python爬虫获取维基百科词条
zudiak1313:
请问如何购买或获取您抓取的词条?
您愿意向朋友推荐“博客详情页”吗?
强烈不推荐
不推荐
一般般
推荐
强烈推荐
提交
最新文章
【论文阅读-Transformer】Attentionisallyouneed
【论文阅读-对比学习】ConstructingContrastiveSamplesviaSummarizationforTextClassification
【论文阅读-可解释性】OnSampleBasedExplanationMethodsforNLPEfficiency,Faithfulness,andSemantic
2022年14篇
2021年13篇
2020年3篇
2019年7篇
目录
目录
分类专栏
论文阅读
13篇
对比学习
4篇
ICD自动编码
3篇
机器学习
10篇
Python
4篇
Leetcode
2篇
错题本
4篇
工具箱
8篇
目录
打赏作者
_春天_
你的鼓励将是我创作的最大动力
¥2
¥4
¥6
¥10
¥20
输入1-500的整数
余额支付
(余额:--)
扫码支付
扫码支付:¥2
获取中
扫码支付
您的余额不足,请更换扫码支付或充值
打赏作者
实付元
使用余额支付
点击重新获取
扫码支付
钱包余额
0
抵扣说明:
1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、C币套餐、付费专栏及课程。
余额充值
延伸文章資訊
- 1PyCWN: A python module for chinese wordnet - NTU Scholars
標題: PyCWN: A python module for chinese wordnet. 作者: Wu, Y.-C. Hsieh, S.-K. SHU-KAI HSIEH. 公開日期: 2...
- 2PyCWN: a Python Module for Chinese Wordnet - ACL Anthology
This presentation introduces a Python module (PyCWN) for accessing and processing. Chinese lexica...
- 3wordnet python处理中文与英文 - CSDN博客
wordnet python处理中文与英文 · print( wn.synset('apple.n.01').definition()) · fruit with red or yellow o...
- 4中文WordNet的安装与使用__春天 - CSDN博客
具体调用过程与词义查询基本一致。 英文. from nltk.corpus import wordnet as wn # 方法一: print ...
- 5NLTK synset with other languages - python 2.7 - Stack Overflow
It looks like there is a Chinese (cmn) WordNet available from a university in Taiwan: http://cast...