中文WordNet的安装与使用__春天 - CSDN博客

文章推薦指數: 80 %
投票人數:10人

具体调用过程与词义查询基本一致。

英文. from nltk.corpus import wordnet as wn # 方法一: print ... 中文WordNet的安装与使用 _春天_ 于 2021-06-2819:44:36 发布 1360 收藏 9 分类专栏: 机器学习 文章标签: python wordnet 机器学习 版权声明:本文为博主原创文章,遵循CC4.0BY-SA版权协议,转载请附上原文出处链接和本声明。

本文链接:https://blog.csdn.net/weixin_42294274/article/details/118309645 版权 机器学习 专栏收录该内容 10篇文章 0订阅 订阅专栏 最近在中文语料上数据分析,想借用一些外部资源,就想到了WordNet,在这里记录一下,以备后用。

文章目录 (一)WordNet的介绍(二)WordNet的安装(三)中英文WordNet的使用(1)词义查询(2)同义词查询(3)其他查询 (一)WordNet的介绍 WordNet是由Princeton大学的心理学家,语言学家和计算机工程师联合设计的一种基于认知语言学的英语词典。

它不是光把单词以字母顺序排列,而且按照单词的意义组成一个“单词的网络”。

它是一个覆盖范围宽广的英语词汇语义网。

名词,动词,形容词和副词各自被组织成一个同义词的网络,每个同义词集合都代表一个基本的语义概念,并且这些集合之间也由各种关系连接。

WordNet包含描述概念含义,一义多词,一词多义,类别归属,近义,反义等问题,访问以下网页,可使用wordnet的基本功能:http://wordnetweb.princeton.edu/perl/webwn (二)WordNet的安装 首先要安装nltk. pipinstallnltk 然后用nltk的downloader下载“wordnet”,获取相关的数据。

importnltk nltk.download('wordnet')#这是英文的wordnet 如果要使用中文的WordNet,需要再下载一个组件“omw”。

nltk.download('omw')#omw代表OpenMultilingualWordnet 安装好以后,就可以使用啦。

(三)中英文WordNet的使用 (1)词义查询 word.definition() 英文 fromnltk.corpusimportwordnetaswn #获得单个词的定义查询 apple=wn.synset('apple.n.01') print(apple.definition()) #获得该词的所有词性及解释下的定义 word='apple' forwinwn.synsets(word): print(w.definition()) #输出: #fruitwithredoryelloworgreenskinandsweettotartcrispwhitishflesh #fruitwithredoryelloworgreenskinandsweettotartcrispwhitishflesh #nativeEurasiantreewidelycultivatedinmanyvarietiesforitsfirmroundedediblefruits 中文 因为中文在查询时,本质上还是映射到英文语义上去,所以不能直接用类似“秘密.n.01”这种形式,只用用synsets来查,synset是没有‘lang’这个参数的。

word='秘密' print('originword:',word) iflen(wn.synsets(word,lang='cmn'))==0: print('Nothisword') forwinwn.synsets(word,lang='cmn'): print(w) print(w.definition()) #输出: #originword:秘密 #Synset('mystery.n.01') #somethingthatbafflesunderstandingandcannotbeexplained #Synset('secret.n.01') #somethingthatshouldremainhiddenfromothers(especiallyinformationthatisnottobepassedon) #Synset('privacy.n.02') #theconditionofbeingconcealedorhidden 一些注释 一个词可能同时具有动词、名词等多种词性,而且每个词性下可能具有多种解释。

例如,在查询"privacy"一词时: “privacy.n.01”代表“thequalityofbeingsecludedfromthepresenceorviewofothers”,"privacy.n.02"代表“theconditionofbeingcncealedorhidden” n代表名词,v代表动词,数字代表第几个。

` (2)同义词查询 word.lemma_names() 具体调用过程与词义查询基本一致。

英文 fromnltk.corpusimportwordnetaswn #方法一: print(wn.synset('apple.n.01').lemma_names()) #方法二: forwinwn.synsets('apple'): print(w.lemma_names()) 中文 word='秘密' forwinwn.synsets(word,lang='cmn'): print(w.lemma_names()) #输出 #['privacy','privateness','secrecy','concealment'] #['mystery','enigma','secret','closed_book'] #['mystery','enigma','secret','closed_book'] 这里相当于是,把中文的“秘密”与英文中的词做了一个对应,对应到三个名词,分别是上面提到的’mystery.n.01’,‘secret.n.01’和‘privacy.n.02’。

在找同义词时,分别找到了“秘密”这个中文词对应的三个英文词的同义词。

(3)其他查询 hypernyms()#上位(父类) hyponyms()#下位(子类) lemma_names()#同义 antonyms()#反义 entailments()#蕴含关系 part_meronyms()#部分 substance_meronyms()#实质 member_holonyms()#成员 目前只用到了同位词,以后用到什么其他的模块,再来补充吧。

参考:https://blog.csdn.net/xieyan0811/article/details/82314042https://blog.csdn.net/MAILLIBIN/article/details/100580676 _春天_ 关注 关注 3 点赞 踩 0 评论 9 收藏 打赏 扫一扫,分享内容 点击复制链接 专栏目录 中文版wordnet 07-02 以前做项目时看过个,可惜后来还是没怎么用上。

从官网上下载的,只有32个表,好像内容并不全。

献给有需要的人。

NLTKwordnet.zip 12-01 id:wordnet;size:10775600;author:;copyright:WordNet3.0Copyright2006byPrincetonUniversity.Allrightsreserved.;license:Permissiontouse,copy,modifyanddistributethissoftwareanddatabaseanditsdocumentationforanypurposeandwithoutfeeorroyaltyisherebygranted,providedthatyouagreetocomplywiththefollowingcopyrightnoticeandstatements,includingthedisclaimer,andthatthesameappearonALLcopiesofthesoftware,databaseanddocumentation,includingmodificationsthatyoumakeforinternaluseorfordistribution....[seewebpageforfulllicense]; 参与评论 您还未登录,请先 登录 后发表或查看评论 词语相似度计算:1、安装NLTK和下载WordNet语料库;WordNet的使用 mmc2015的专栏 03-21 1万+ NLTK在anaconda中有,WordNet语料库需要手动下载。

这里主要介绍如何下载wordnet语料库。





In[1]:fromnltk.corpusimportwordnetaswn In[2]:wn.syssets('love') Traceback(mostrecentcalllast): File"",line1,in WordNet介绍和使用 热门推荐 计算所信息抽取小组专栏 03-20 4万+ Wordnet是一个词典。

每个词语(word)可能有多个不同的语义,对应不同的sense。

而每个不同的语义(sense)又可能对应多个词,如topic和subject在某些情况下是同义的,一个sense中的多个消除了多义性的词语叫做lemma。

例如,“publish”是一个word,它可能有多个sense:1.(39)print,publish--(putintoprint pythonWordNet的使用方法(整理版) King_John的专栏 05-09 1万+ wordNet的安装和使用 WordNet简介 weixin_34050427的博客 04-08 414 WordNet 1WordNet简介  传统词典一般都是按字母顺序组织词条信息的,这样的词典在解决用词和选义问题上是有价值的。

然而,它们有一个共同的缺陷,就是忽略了词典中同义信息的组织问题。

20世纪以来,语言学家和心理学家们开始从一个崭新的角度来探索现代语言学知识结构以及特定的词典结构,终于由Princeton大学研制成功了一个联机英语词汇检索系统—WordNet,它作为语言学本体库,同时又... 快速了解WordNet 最新发布 子燕若水的博客 09-22 463 1、什么是WordNet WordNet是由Princeton大学的心理学家,语言学家和计算机工程师联合设计的一种基于认知语言学的英语词典。

它不是光把单词以字母顺序排列,而且按照单词的意义组成一个“单词的网络”。

WordNet是一个覆盖范围宽广的英语词汇语义网。

名词,动词,形容词和副词各自被组织成一个同义词的网络,每个同义词集合都代表一个基本的语义概念,并且这些集合之间也由各种关系连接。

Wordnet的词汇结构包括九大类:上下位关系(动词、名词)、蕴含关系(动词)、相似关系(名词)、成员部分关.. 知识图谱之WordNet 谢彦的技术博客 09-02 1万+ 1.说明  今天讨论的是自然语言中的知识抽取和知识表示,换言之,就是如何从大量的书籍文献中剥离出我们关心的所谓“知识”,并将起组织保存成简单可用的描述。

 不同的知识类型需要采用不同的知识表示方式,温有奎教授总结了10种知识类型(具体见参考部分)。

对于静态概念及概念之间关系用面向对象形式来表示,对命题型问题用一阶逻辑来表示,对于系统流程和实验流程等过程性知识用脚本表示法。

 静态概念是... 用WordNet实现中文情感分析 谢彦的技术博客 03-14 1万+ 用WordNet实现中文情感分析 WordNet介绍 weixin_43963453的博客 09-25 705 WordNet介绍 中文情感分析实例---WordNet 不朽的博客 02-27 1658 1.安装nltk   pipinstallnltk 2.下载文本到本地 ----wordnet汉语开放词网,可从以下网址下载:http://compling.hss.ntu.edu.sg/cow/ ----停用词:参考以下网页,另外加入常用标点符号http://blog.csdn.net/u010533386/article/details/51458591 3.下载WordNet... wordnet的中文支持项目openmultilingualwordnet分析试用 建模分析师胡选来 03-17 2686 主要关注中文的对应英文,一词多义,多词同义,词相似度功能。

#下载openmultilingualwordnet语料 importnltk nltk.download("wordnet") nltk.download("wordnet_ic") nltk.download('omw') fromnltk.corpusimportwordnetaswn #wor wordnet-lmf:WordNet词法标记框架(LMF) 05-29 WordNet-LMF WordNet词法标记框架(LMF) 关于 这是一个命令行接口(CLI)和底层应用程序编程接口(API),用于解析格式文件并将数据导入紧凑的SQLite数据库文件。

这种方法的动机是:一个100MB的LMFXML消耗大约1GB的RAM(由于XMLDOM)并且查询速度非常慢,而相应的SQLite数据库文件只是LMFXML文件大小的20%左右,并且可以非常快速地查询并且消耗无害的RAM。

此NPM模块仅附带用于处理LMFXML文件的LMFCLI和API,不附带任何特定的LMFXML文件。

请参阅LMFXML/SQLite格式的英语和德语WordNet的配套模块和。

资料模型 基于DTD,我们派生并记录了我们在此NPM模块中使用的。

链接 安装 $npminstall WordNet的使用 LawsonAbs'sSpiritualHome 11-14 428 简要介绍如何使用wordNet wordnetpython处理中文与英文 Pursue_MyHeart的博客 06-09 6497 一、英文1.安装nltk,导入Wordnet,Python版本3.5fromnltk.corpusimportwordnetaswn2.同义词集的定义 car.n.01是car的一个名词意义,被称之为同义词集,也就是意义相同的词(或词条)的集合。

这里的’dog.n.01’指:dog的第一个名词意思;’chase.v.01’指:chase的第一个动词意思,后面我们可以用definitio... Python使用wordnet工具计算词集与词条基本用法(一) 呆萌的代Ma 08-05 168 wordnet源文件下载地址:https://wordnet.princeton.edu/download/current-version 要把wordnet当做工具使,首先要导入包: fromnltk.corpusimportwordnetaswn 在wordnet中的标识: 形容词(adj):a 副词(adv):r 名词(n):n 动词(v):v 基本用法 参考文档 WordNet:https://wordnet.princeton.edu/ Language:https://ww python常用单词有多少_python–NLTK每个单词最常见的同义词(Wordnet) weixin_39855869的博客 11-23 73 同义词很棘手,但是如果你开始使用Wordnet的synset并且你只想选择集合中最常见的成员,那么它非常简单:只需从语料库中构建自己的频率列表,然后查找每个成员.synset选择最大值.nltk将让您只需几行代码即可构建频率表.这是基于布朗语料库的一个:fromnltk.corpusimportbrownfreqs=nltk.FreqDist(w.lower()forwinbr... WordNet使用方法 ~菜鸟学飞~的专栏 12-18 3995 在WordNet中有词语的各种信息,定义、同义、上位、下位、实例、包含等等关系的词集,通过调用相应方法可一一获取,然后进行同义词计算、类别划分等操作。

源码的main()函数在wn.c文件中。

注意:若在windows环境下调用,则需要在wn.h和wnutil.c文件首行添加 #define_WINDOWS123宏定义,否则编译报错。

//printthesynsetandhype “相关推荐”对你有帮助么? 非常没帮助 没帮助 一般 有帮助 非常有帮助 提交 ©️2022CSDN 皮肤主题:大白 设计师:CSDN官方博客 返回首页 _春天_ CSDN认证博客专家 CSDN认证企业博客 码龄4年 暂无认证 36 原创 89万+ 周排名 6万+ 总排名 3万+ 访问 等级 479 积分 13 粉丝 30 获赞 16 评论 59 收藏 私信 关注 热门文章 【论文阅读-对比学习】ConSERT-AContrastiveFrameworkforSelf-SupervisedSentenceRepresentationTransfer 3848 pandas用read_csv读取txt文件时,部分行丢失 3705 matplotlib画图——y轴不均匀/不等距刻度、对数刻度图 2835 【书籍阅读】-人在回路机器学习Human-in-the-LoopMachineLearning(一) 2750 Latex打勾打叉 2386 分类专栏 论文阅读 13篇 对比学习 4篇 ICD自动编码 3篇 机器学习 10篇 Python 4篇 Leetcode 2篇 错题本 4篇 工具箱 8篇 最新评论 Latex带圈的序号 醉陶然315: 特别感谢你的分享,很清楚 Latex打勾打叉 xuzheng00: 帮忙了/抱拳 论文翻译|疾病自动编码|Clinical-Coder:AssigningInterpretableICD-10CodestoChineseClinicalNotes weixin_45344171: 请问可以复现该论文代码吗 python爬虫获取维基百科词条 _春天_: 自己爬就行,不用买吧 python爬虫获取维基百科词条 zudiak1313: 请问如何购买或获取您抓取的词条? 您愿意向朋友推荐“博客详情页”吗? 强烈不推荐 不推荐 一般般 推荐 强烈推荐 提交 最新文章 【论文阅读-Transformer】Attentionisallyouneed 【论文阅读-对比学习】ConstructingContrastiveSamplesviaSummarizationforTextClassification 【论文阅读-可解释性】OnSampleBasedExplanationMethodsforNLPEfficiency,Faithfulness,andSemantic 2022年14篇 2021年13篇 2020年3篇 2019年7篇 目录 目录 分类专栏 论文阅读 13篇 对比学习 4篇 ICD自动编码 3篇 机器学习 10篇 Python 4篇 Leetcode 2篇 错题本 4篇 工具箱 8篇 目录 打赏作者 _春天_ 你的鼓励将是我创作的最大动力 ¥2 ¥4 ¥6 ¥10 ¥20 输入1-500的整数 余额支付 (余额:--) 扫码支付 扫码支付:¥2 获取中 扫码支付 您的余额不足,请更换扫码支付或充值 打赏作者 实付元 使用余额支付 点击重新获取 扫码支付 钱包余额 0 抵扣说明: 1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。

2.余额无法直接购买下载,可以购买VIP、C币套餐、付费专栏及课程。

余额充值



請為這篇文章評分?