Hownet | 世界语言资源平台
文章推薦指數: 80 %
知网(Hownet)是我国计算语言学家董振东、董强在上世纪90年代提出并制作的一个常识知识库。
知网以汉语和英语的词汇所代表的概念为描述对象,意在揭示 ...
提供者:金天华
WelcometoHownet
简介:知网(Hownet)是我国计算语言学家董振东、董强在上世纪90年代提出并制作的一个常识知识库。
知网以汉语和英语的词汇所代表的概念为描述对象,意在揭示概念与概念之间及概念所具有的属性之间的关系。
这也是知网对“知识”的定义,将知识看做一种系统关系,并将之结构化、可视化,就是知网所做的事情。
知网的特点:知网采用意义分解的方法来描述概念。
它从词语的义项中抽取出最小的意义单位(即义原),用义原和角色关系来描述词汇和词汇概念。
义原不仅是知网中最小的语义单位,也是知网知识系统的基本单位。
在这个过程中,董振东和董强先生始终坚持“分类宜粗不宜细,特征描述宜粗不宜细”的原则,使得知网2000个义原都是唯一而没有歧义的。
事件概念分类的双轴轮(BiaxialTheory)是知网构架的支点,充分揭示了事物间复杂的关系,便于建立概念的描述体系和建立推理机制。
知网中事件可以分为动态和静态两种,静态的事件又可以分为表示关系的和表示事物发展状态的,动态的事件表示行为动作的“改变”。
在知网中,事件共计812类,除事件自身这一最高类别外,静态事件有215类,动态事件有596类。
静态事件中,表示关系的有52类,表示状态的有163类。
动态事件中,与静态事件中表示关系的相对应,即表示改变关系的有222类,而与静态事件中表示状态的相对应,即表示改变状态的有336类。
在596类动态事件中,还包括了38类被知网称为“泛动”的事件,就是表示“行动”但没有明确表示改变关系还是改变状态的词,例如“试”“做”等。
知网系统的概貌:知网系统包括了下列数据文件和程序:1.中英双语知识词典:包含内容有框架网描写的词汇和义原释义及语义角色。
根据事件、实体属性、第二特征等分类别放置;2.知网管理工具:包含了知网的概念计算工具和语义相似度计算工具及其API;3.知网说明文件: 动态角色与属性, 词类表, 同义、反义以及对义组的形成, 事件关系和角色转换, 标识符号及其说明
基于知网的义原分析,我们可以计算词语之间的相似度以及抽取词语框架。
最新版本的知网规模如下:
相关论文
Dong.Zhendong.Knowledgedescription:what,how,andwho?[A].Manuscript&ProgramofInternationalSymposiumonElectronicDictionary[C].Tokyo:1988.18.
ZhendongDong,QiangDong.HowNetandtheComputationofMeaning[M].Singapore:WorldScientificPublishingCompany,2006.
董振东、董强、郝长伶,知网的理论发现[J]中文信息学报,2007.7.
刘群,李素建,基于《知网》的词汇语义相似度计算第三届中文词汇语义学研讨会论文集
YilinNiu,RuobingXie,ZhiyuanLiu,MaosongSun.ImprovedWordRepresentationLearningwithSememes.InACL,2017.
RuobingXie,XingchiYuan,ZhiyuanLiu,MaosongSun.LexicalSememePredictionviaWordEmbeddingsandMatrixFactorization.InIJCAI,2017.
XiangkaiZeng,ChengYang,CunchaoTu,ZhiyuanLiu,MaosongSun.ChineseLIWCLexiconExpansionviaHierarchicalClassificationofWordEmbeddingswithSememeAttention.InAAAI,2018.
文章目录
站点概览
CNLR
语料库、数据集及工具资源和教程
218
日志
3
标签
1.WelcometoHownet2.简介:3.知网的特点:4.知网系统的概貌:5.相关论文
延伸文章資訊
- 1在深度学习时代用HowNet搞事情 - 知乎专栏
HowNet是董振东先生、董强先生父子毕三十年之功标注的大型语言知识库,主要面向中文(也包括英文)的词汇与概念[1]。HowNet秉承还原论思想,认为词汇/ ...
- 2CKIP Lab 中文詞知識庫小組| 廣義知網 - 中央研究院
廣義知網(E-HowNet) 是中央研究院資訊所詞庫小組於2003年與董振東先生展開建構繁體字知網的合作計畫,我們承續知網的語意定義機制,將中央研究院詞庫小組辭典(CKIP ...
- 3HowNet介绍及相关API的使用方法 - CSDN博客
知网(英文名称HowNet),是一个以汉语和英语的词语所代表的的概念为描述对象,以揭示概念与概念之间以及概念所具有的属性之间的关系为基本内容的常识 ...
- 4廣義知網詞彙意見極性的預測Predicting the Semantic ...
第二節介紹廣義知網、及英文和中文相關的情緒屬性標記研究,第三節介紹從. E-HowNet 及Google Chinese Web 5-gram 抽取特徵的方法,第四節呈現各種實驗的結果. 及分析...
- 5「三名本科生搞事情」用HowNet成功融入深度學習模型
HowNet是董振東先生、董強先生父子畢數十年之功標註的大型語言知識庫,主要面向中文(也包括英文)的詞彙與概念[1]。 HowNet秉承還原論思想,認為詞彙/ ...