Hownet | 世界语言资源平台

文章推薦指數: 80 %
投票人數:10人

知网(Hownet)是我国计算语言学家董振东、董强在上世纪90年代提出并制作的一个常识知识库。

知网以汉语和英语的词汇所代表的概念为描述对象,意在揭示 ... 提供者:金天华 WelcometoHownet 简介:知网(Hownet)是我国计算语言学家董振东、董强在上世纪90年代提出并制作的一个常识知识库。

知网以汉语和英语的词汇所代表的概念为描述对象,意在揭示概念与概念之间及概念所具有的属性之间的关系。

这也是知网对“知识”的定义,将知识看做一种系统关系,并将之结构化、可视化,就是知网所做的事情。

知网的特点:知网采用意义分解的方法来描述概念。

它从词语的义项中抽取出最小的意义单位(即义原),用义原和角色关系来描述词汇和词汇概念。

义原不仅是知网中最小的语义单位,也是知网知识系统的基本单位。

在这个过程中,董振东和董强先生始终坚持“分类宜粗不宜细,特征描述宜粗不宜细”的原则,使得知网2000个义原都是唯一而没有歧义的。

事件概念分类的双轴轮(BiaxialTheory)是知网构架的支点,充分揭示了事物间复杂的关系,便于建立概念的描述体系和建立推理机制。

知网中事件可以分为动态和静态两种,静态的事件又可以分为表示关系的和表示事物发展状态的,动态的事件表示行为动作的“改变”。

在知网中,事件共计812类,除事件自身这一最高类别外,静态事件有215类,动态事件有596类。

静态事件中,表示关系的有52类,表示状态的有163类。

动态事件中,与静态事件中表示关系的相对应,即表示改变关系的有222类,而与静态事件中表示状态的相对应,即表示改变状态的有336类。

在596类动态事件中,还包括了38类被知网称为“泛动”的事件,就是表示“行动”但没有明确表示改变关系还是改变状态的词,例如“试”“做”等。

知网系统的概貌:知网系统包括了下列数据文件和程序:1.中英双语知识词典:包含内容有框架网描写的词汇和义原释义及语义角色。

根据事件、实体属性、第二特征等分类别放置;2.知网管理工具:包含了知网的概念计算工具和语义相似度计算工具及其API;3.知网说明文件:  动态角色与属性,  词类表,  同义、反义以及对义组的形成,  事件关系和角色转换,  标识符号及其说明 基于知网的义原分析,我们可以计算词语之间的相似度以及抽取词语框架。

最新版本的知网规模如下: 相关论文 Dong.Zhendong.Knowledgedescription:what,how,andwho?[A].Manuscript&ProgramofInternationalSymposiumonElectronicDictionary[C].Tokyo:1988.18. ZhendongDong,QiangDong.HowNetandtheComputationofMeaning[M].Singapore:WorldScientificPublishingCompany,2006. 董振东、董强、郝长伶,知网的理论发现[J]中文信息学报,2007.7. 刘群,李素建,基于《知网》的词汇语义相似度计算第三届中文词汇语义学研讨会论文集 YilinNiu,RuobingXie,ZhiyuanLiu,MaosongSun.ImprovedWordRepresentationLearningwithSememes.InACL,2017. RuobingXie,XingchiYuan,ZhiyuanLiu,MaosongSun.LexicalSememePredictionviaWordEmbeddingsandMatrixFactorization.InIJCAI,2017. XiangkaiZeng,ChengYang,CunchaoTu,ZhiyuanLiu,MaosongSun.ChineseLIWCLexiconExpansionviaHierarchicalClassificationofWordEmbeddingswithSememeAttention.InAAAI,2018. 文章目录 站点概览 CNLR 语料库、数据集及工具资源和教程 218 日志 3 标签 1.WelcometoHownet2.简介:3.知网的特点:4.知网系统的概貌:5.相关论文



請為這篇文章評分?