中文詞彙網路CWN 2.0

文章推薦指數: 80 %
投票人數:10人

中文詞彙網路(Chinse Wordnet,CWN),是一項試圖解決詞義(sense)以及詞彙語意關係(lexical semantic relations)的語言知識資源。

中文詞網的核心元素是中文詞彙的 ... 中文詞彙網路CWN2.0 關於(About) 查詢(Query) 下載(Download) 結束選單× 關於(About) 查詢(Query) 下載(Download) 29,321 詞條 29,415 詞意 12,620 同義詞集 59,993 詞意關係 關於中文詞彙網路 CWN簡介 相關人員 研究發表 CWN簡介 中文詞彙網路(ChinseWordnet,CWN),是一項試圖解決詞義(sense)以及詞彙語意關係(lexicalsemanticrelations)的語言知識資源。

中文詞網的核心元素是中文詞彙的同義詞集(synsets)以及連繫各詞集的語意關係;透過語意關係,將各個同義詞集連接起來,形成語意網絡。

中文詞彙網路累積了近二十年的研究成果,起初由中研院語言學研究所推動,於2010年完成,目前中文詞彙網路由臺大語言所負責維護,並著力開發更廣泛且靈活的工具資源以供使用,例如:XML、SQLite格式、WordNetLMF資料格式等等。

中文詞彙網絡收錄範圍為實詞(openclass),亦即名詞、動詞、形容詞及副詞。

第一次使用中文詞網,可以參考新手教學、快速上手/小工具。

在數位人文的時代,附有標記的語料資料常是計算語言學與自然語言處理不可或缺的實用資源,更多語言的詞彙網路建立,也讓這項資源成為跨語言的研究素材。

架構 WordNet中單詞之間的主要關係是同義詞,例如關閉和關閉或汽車與汽車之間的同義詞。

同義詞-表示相同概念並且在許多情況下可以互換的單詞-被分組為無序集合(同義詞集)。

WordNet的11.7萬個同義詞集中的每一個都通過少量的“概念關係”鏈接到其他同義詞集。

此外,同義詞集包含一個簡短定義(“光澤”),並且在大多數情況下,一個或多個簡短的句子說明了用法同義詞集成員。

具有多種不同含義的單詞形式以多種不同的同義詞集表示。

因此,WordNet中的每個形式含義對都是唯一的。

語意關係 同義詞集之間最頻繁編碼的關係是超從屬關係(也稱為重名,下位或ISA關係)。

它將更通用的同義詞集(例如{furniture,piece_of_furniture})鏈接到越來越具體的同義詞集(例如{bed}和{bunkbed})。

因此,WordNet指出,家具類別包括床,而床又包括雙層床。

相反,床和束縛等概念構成了家具類別。

所有名詞層次最終都在根節點{entity}上。

假名關係是傳遞性的:如果扶手椅是一種椅子,而椅子是一種家具,那麼扶手椅是一種家具。

WordNet區分類型(通用名詞)和實例(特定人員,國家/地區和地理實體)。

因此,扶手椅是椅子的一種,巴拉克·奧巴馬(BarackObama)是總統的一個實例。

實例在其層次結構中始終是葉(終端)節點。

代名詞,{椅子}和{靠背,靠背},{seat}和{leg}等同義詞集之間存在整體關係。

零件是從上級繼承的:如果椅子有腿,那麼扶手椅也有腿。

零件不是“向上”繼承的,因為它們可能僅是特定種類的事物而不是整個類的特徵:椅子和各種椅子都具有腿,但並非所有家具都具有腿。

動詞同義詞集也按層次排列。

指向樹底的動詞(異義詞)表示事件的特徵越來越具體,例如{communicate}-{talk}-{whisper}。

具體表達方式取決於語義領域。

音量(如上面的示例中所示)只是一維,可以沿動詞闡述動詞。

其他的則是速度(慢跑)或情緒強烈(如愛偶像化)。

描述必要且單向涉及彼此的事件的動詞已鏈接:{購買}-{支付},{成功}-{嘗試},{顯示}-{see}等。

形容詞是根據反義詞來組織的。

成對的“直接”反義詞,例如乾濕的和年輕的,反映了其成員的強語義約束。

這些極性形容詞中的每一個又與許多“在語義上相似”的形容詞相關:幹與乾熱,乾旱,乾燥,乾燥,濕潤與濕潤,浸水等相關。

語義上相似的形容詞是“形容詞”的“間接反義詞”。

另一極的轉換部件。

關係形容詞(“ pertainyms”)指向它們衍生自的名詞(犯罪犯罪)。

WordNet中僅有少量副詞(幾乎,幾乎,真正等),因為大多數英語副詞都是通過詞綴從形容詞直接衍生而來的(令人驚訝,奇怪的是,等等)。

跨詞性關係 WordNet的大多數關係都將來自同一詞性(POS)的詞聯繫起來。

因此,WordNet實際上包含四個子網,每個子網分別用於名詞,動詞,形容詞和副詞,幾乎沒有跨POS指針。

跨POS關係包括“形態語義學”鏈接,這​​些鏈接在語義相似的單詞之間共享,它們具有相同的含義,其詞幹具有相同的含義:觀察(動詞),觀察(形容詞)觀察,觀察(名詞)。

在許多名詞-動詞對中,已經指定了名詞相對於動詞的語義作用:{sleeper,sleeping_car}是{sleep}的位置,{painter}是{paint}的代理,而{painting ,picture}是其結果。

相關人員 現任維護團隊 謝舒凱----LOPE實驗室主持人 曾昱翔----LOPE實驗室博士後研究人員 古貿昌----LOPE實驗室博士生 石晴方----LOPE實驗室碩士生 江琼玉----LOPE實驗室研究人員 陳蓓怡----LOPE實驗室碩士生 廖永賦----LOPE實驗室碩士生 曾參與計畫之貢獻者 李智堯----LOPE實驗室博士生 張瑜芸----政大語言所助理教授 施孟賢----政大博士後研究員 中文詞庫小組(資源建構者) 黃居仁----香港理工大學教授 研究發表 2019 Hsieh,S.K.,Tseng,Y.H.,Lee,C.Y.,&Chiang,C.Y.(2019).ModelingtheIdiomaticityofChinese Quadra-syllabicIdiomaticExpressions.Paperpresentedinthe33rdPacificAsiaConferenceon Language,InformationandComputation.Hakodate,Japan. Tseng,Y.H.&Hsieh,S.K.(2019).AugmentingChineseWordNetsemanticrelationswith contextualizedembeddings.Paperpresentedinthe10thGlobalWordNetConference.Wroclaw,Poland. 2018 Hsieh,S.K.,Tseng,Y.H.,Lee,C.Y.,&Chiang,C.Y.(2018).FluidAnnotation:A Granularity-awareAnnotationToolforChineseWordFluidity.PaperpresentedinEleventhInternational ConferenceonLanguageResourcesandEvaluation.Miyazaki,Japan. CWN簡介 相關人員 研究發表 線上查詢 無該字詞 {{currentWord}}({{group_key}})有{{grouped_senses.length}}個詞意 {{sense.pos}} {{idx+1}}.{{sense.definition}} toggleShowFullExamples(sense.cwn_id)" class="example-preview">{{sense.examples[0]}} toggleShowFullExamples(sense.cwn_id)">  收起例句  {{example}} 下載資料 使用下載資料請先閱讀引用方式與授權方式 CWN2.0v2022.04Apr,2022 最新釋出的版本,需搭配CwnGraph CWNGraph0.3.0Apr,2022 CWNPythonAPI CWN1.0SQLiteSep28,2010 引用方式 黃居仁(2007-2009)、謝舒凱(2009-2010):跨語言知識表徵基礎架構─面向多語化與全球化的語言學研究。

國科會專題補助計畫(NSC96-2411-H-003-061-MY3) Chu-RenHuangandShu-KaiHsieh.(2010).InfrastructureforCross-lingualKnowledgeRepresentation─ TowardsMultilingualisminLinguisticStudies.TaiwanNSC-grantedResearchProject(NSC 96-2411-H-003-061-MY3) 黃居仁,謝舒凱,洪嘉馡,陳韻竹,蘇依莉,陳永祥,黃勝偉.中文詞彙網路:跨語言知識處理基礎架構的設計理念與實踐.中國語文,24卷第二期 致謝 詞彙網絡計畫2.0感謝科技部計畫「建構概念為本且具語義結合性的中文 知識庫」的支持 授權方式 「中文詞彙網路」資料使用規範(TermsofUseofCWN) 中文詞彙網路是國科會計畫的工作成果。

(CWNisanNSC-sponsoredproject.) 中文詞彙網路之語料與程式皆可自由下載,但僅供學術研究之用,不得有任何商業行為。

(ThecorpusdataandapplicationsofCWNcanbefreely downloaded andusedforacademicpurposes.Nocommercialuseisallowed.) 未獲同意,不得將中文詞彙網路資料轉載。

(Withoutpermission,reproducingthecontentsofCWNisprohibited.) 因中文詞彙網路而產生任何研究成果,請在論文中引用以下論文或計畫名稱:(AnyresearchstudieswithresultsderivedfromCWNshould includethe followingcitationsofpapers/projects:) 黃居仁(2007-2009)、謝舒凱(2009-2010):跨語言知識表徵基礎架構─面向多語化與全球化的語言學研究。

國科會專題補助計畫(NSC 96-2411-H-003-061-MY3) Chu-RenHuangandShu-KaiHsieh.(2010).InfrastructureforCross-lingualKnowledgeRepresentation ─ TowardsMultilingualisminLinguisticStudies.TaiwanNSC-grantedResearchProject(NSC 96-2411-H-003-061-MY3) 黃居仁,謝舒凱,洪嘉馡,陳韻竹,蘇依莉,陳永祥,黃勝偉.中文詞彙網路:跨語言知識處理基礎架構的設計理念與實踐.中國語文,24卷第二期



請為這篇文章評分?