How to annotate in Chinese WordNet (CWN) - 中文詞彙網路 ...
文章推薦指數: 80 %
中文詞彙網路標記小實作 · 在cwn.lite計畫中,如何標記新的lemma以及相關features是重要的。
· 在此,我們利用cwn的資料以及Sean大神的程式碼來做一點cwn ...
在cwn.lite計畫中,如何標記新的lemma以及相關features是重要的。
在此,我們利用cwn的資料以及Sean大神的程式碼來做一點cwn標記的小實作,共分為基本graphquery以及annotation兩大部分。
I.CwnGraphQuery
%load_extautoreload
%autoreload2
importpickle
fromCwnGraphimportCwnBase,CwnAnnotator
fromCwnGraphimportCwnRelationType
#loadincwndatabase
cwn=CwnBase("data/cwn_graph.pyobj")
#sensenode數目
len(cwn.V)
90780
查詢synset以及其sense:以「看」的synset為例
lemmas=cwn.find_lemma("看")
print(lemmas)
[
',
'examples':['欸欸欸,你,這我們的存款簿,怎麼好幾個月都沒存錢進去了?',
'找本書,找一個山明水秀的地方,好好的輕鬆一下、靜一靜、書。
',
'最近常經過這些擠滿人的書店,才鼓起勇氣不妨進去,為什麼那麼吸引人?',
'天未明時,我走到屋外,抬頭天空,只見月兒彎彎,群星為伴,讓人感覺到那分寂靜之美。
',
'廣場的對面是一個像高雄火車站那樣的建築物。
我車站的名字,那站名是我聞所未聞的。
'],
'node_type':'sense',
'pos':'VC'}
查詢synset以及其sense:查詢「看看_1」每個sense與其他lemma/sense的語意關係
forsense_xinsenses:
print(sense_x)
print(sense_x.relations)
print("--")
若已存在該lemma,那就直接新增相關資訊就好。
#發現lemma"五神無主"不存在並新增它
findlemma=cwn.find_lemma('五神無主')
findlemma
new_lemma=annot.create_lemma('五神無主')
new_lemma
")
my_sense
"]
annot.set_sense(my_sense)
#Seethestructure
annot.V
{'132394':{'annot':{},
'lemma':'振奮',
'lemma_sno':1,
'node_type':'lemma',
'zhuyin':'ㄓㄣˋㄈㄣˋ'},
'cwn_testing_000001':{'annot':{},
'lemma':'五神無主',
'lemma_sno':1,
'node_type':'lemma',
'zhuyin':''},
'cwn_testing_000002':{'annot':{},
'def':'以特定事件鼓勵特定對象,使其增加該事件正面精神特質。
',
'examples':['謝總的鼓勵總是人心。
'],
'node_type':'sense',
'pos':'V'},
'cwn_testing_000003':{'annot':{},
'lemma':'五神無主',
'lemma_sno':1,
'node_type':'lemma',
'zhuyin':''},
'cwn_testing_000004':{'annot':{},
'def':'以特定事件鼓勵特定對象,使其增加該事件正面精神特質。
',
'examples':['謝總的鼓勵總是人心。
'],
'node_type':'sense',
'pos':'V'},
'cwn_testing_000005':{'annot':{},
'lemma':'五神無主',
'lemma_sno':1,
'node_type':'lemma',
'zhuyin':''},
'cwn_testing_000006':{'annot':{},
'def':'以特定事件鼓勵特定對象,使其增加該事件正面精神特質。
',
'examples':['謝總的鼓勵總是人心。
'],
'node_type':'sense',
'pos':'V'}}
連接senses之間的語意關係
#Lookintoaexistedsense
my_lemmas_2=cwn.find_lemma("激")
my_lemma_2=my_lemmas_2[4]
my_lemma_2.senses[3]
延伸文章資訊
- 1中文词汇网路(Chinese Wordnet) - 图谱- 开放知识图谱 - OpenKG
中文词汇网路(Chinese Wordnet, 以下简称中文词网) 计画,目的是在提供完整的中文词义(sense) 区分与词汇语意关系知识库。相信词义的区分与表达,必须 ...
- 2How to annotate in Chinese WordNet (CWN) - 中文詞彙網路 ...
中文詞彙網路標記小實作 · 在cwn.lite計畫中,如何標記新的lemma以及相關features是重要的。 · 在此,我們利用cwn的資料以及Sean大神的程式碼來做一點cwn ...
- 3從桌面資料庫至適用於語意網的詞彙知識本體
中文詞彙網路 ; 語意網 ; 詞彙知識本體 ; 鏈結資料 ; 普林斯頓詞彙網路 ; 數位辭典學 ; Chinese Wordnet ; lexical ontology ; Semantic W...
- 4中文詞彙網路CWN 2.0
中文詞彙網路(Chinse Wordnet,CWN),是一項試圖解決詞義(sense)以及詞彙語意關係(lexical semantic relations)的語言知識資源。中文詞網的核心元素是...
- 5中文词汇网络: 跨语言知识处理基础架构的设计理念与实践 ...
PDF | 中文词汇网络(Chinese WordNet, 简称CWN) 的设计理念, 是在完整的知识系统下兼顾词义与词义关系的精确表达与语言科技应用. 中文词义的区分与词义间关系的精确 ...