Hownet | 世界语言资源平台
文章推薦指數: 80 %
知网(Hownet)是我国计算语言学家董振东、董强在上世纪90年代提出并制作的一个常识知识库。
知网以汉语和英语的词汇所代表的概念为描述对象,意在揭示 ...
提供者:金天华
WelcometoHownet
简介:知网(Hownet)是我国计算语言学家董振东、董强在上世纪90年代提出并制作的一个常识知识库。
知网以汉语和英语的词汇所代表的概念为描述对象,意在揭示概念与概念之间及概念所具有的属性之间的关系。
这也是知网对“知识”的定义,将知识看做一种系统关系,并将之结构化、可视化,就是知网所做的事情。
知网的特点:知网采用意义分解的方法来描述概念。
它从词语的义项中抽取出最小的意义单位(即义原),用义原和角色关系来描述词汇和词汇概念。
义原不仅是知网中最小的语义单位,也是知网知识系统的基本单位。
在这个过程中,董振东和董强先生始终坚持“分类宜粗不宜细,特征描述宜粗不宜细”的原则,使得知网2000个义原都是唯一而没有歧义的。
事件概念分类的双轴轮(BiaxialTheory)是知网构架的支点,充分揭示了事物间复杂的关系,便于建立概念的描述体系和建立推理机制。
知网中事件可以分为动态和静态两种,静态的事件又可以分为表示关系的和表示事物发展状态的,动态的事件表示行为动作的“改变”。
在知网中,事件共计812类,除事件自身这一最高类别外,静态事件有215类,动态事件有596类。
静态事件中,表示关系的有52类,表示状态的有163类。
动态事件中,与静态事件中表示关系的相对应,即表示改变关系的有222类,而与静态事件中表示状态的相对应,即表示改变状态的有336类。
在596类动态事件中,还包括了38类被知网称为“泛动”的事件,就是表示“行动”但没有明确表示改变关系还是改变状态的词,例如“试”“做”等。
知网系统的概貌:知网系统包括了下列数据文件和程序:1.中英双语知识词典:包含内容有框架网描写的词汇和义原释义及语义角色。
根据事件、实体属性、第二特征等分类别放置;2.知网管理工具:包含了知网的概念计算工具和语义相似度计算工具及其API;3.知网说明文件: 动态角色与属性, 词类表, 同义、反义以及对义组的形成, 事件关系和角色转换, 标识符号及其说明
基于知网的义原分析,我们可以计算词语之间的相似度以及抽取词语框架。
最新版本的知网规模如下:
相关论文
Dong.Zhendong.Knowledgedescription:what,how,andwho?[A].Manuscript&ProgramofInternationalSymposiumonElectronicDictionary[C].Tokyo:1988.18.
ZhendongDong,QiangDong.HowNetandtheComputationofMeaning[M].Singapore:WorldScientificPublishingCompany,2006.
董振东、董强、郝长伶,知网的理论发现[J]中文信息学报,2007.7.
刘群,李素建,基于《知网》的词汇语义相似度计算第三届中文词汇语义学研讨会论文集
YilinNiu,RuobingXie,ZhiyuanLiu,MaosongSun.ImprovedWordRepresentationLearningwithSememes.InACL,2017.
RuobingXie,XingchiYuan,ZhiyuanLiu,MaosongSun.LexicalSememePredictionviaWordEmbeddingsandMatrixFactorization.InIJCAI,2017.
XiangkaiZeng,ChengYang,CunchaoTu,ZhiyuanLiu,MaosongSun.ChineseLIWCLexiconExpansionviaHierarchicalClassificationofWordEmbeddingswithSememeAttention.InAAAI,2018.
文章目录
站点概览
CNLR
语料库、数据集及工具资源和教程
218
日志
3
标签
1.WelcometoHownet2.简介:3.知网的特点:4.知网系统的概貌:5.相关论文
延伸文章資訊
- 1在深度学习时代用HowNet搞事情 - 知乎专栏
HowNet是董振东先生、董强先生父子毕三十年之功标注的大型语言知识库,主要面向中文(也包括英文)的词汇与概念[1]。HowNet秉承还原论思想,认为词汇/ ...
- 2HowNet - a hybrid language and knowledge resource - IEEE ...
Abstract: HowNet is an online common-sense knowledge base unveiling inter-conceptual relations an...
- 3Hownet | 世界语言资源平台
知网(Hownet)是我国计算语言学家董振东、董强在上世纪90年代提出并制作的一个常识知识库。知网以汉语和英语的词汇所代表的概念为描述对象,意在揭示 ...
- 4「三名本科生搞事情」用HowNet成功融入深度學習模型
HowNet是董振東先生、董強先生父子畢數十年之功標註的大型語言知識庫,主要面向中文(也包括英文)的詞彙與概念[1]。 HowNet秉承還原論思想,認為詞彙/ ...
- 5HowNet and Its Computation of Meaning - ACL Anthology
HowNet and Its Computation of Meaning. Zhendong Dong. Research Center of Computer. & Language Eng...