語言資料庫 - 謝佳玲老師- 國立臺灣師範大學
文章推薦指數: 80 %
「國立政治大學漢語口語語料庫」包含三個語言的口語語料:中文、客語、閩南語。
語料庫記錄口語語料,並提供外界作為非營利的研究和教學之用。
學生和教師(或其他)經會員 ...
網站導覽|意見信箱|關於我們
線上辭典
教材資源
素材製作
測驗評量
語言資料庫
其他工具
中華語文知識庫
中華語文知識庫以政府的兩岸合編中華大辭典發想為基礎,運用雲端計算技術建立以中華語文為核心的文化寶庫,不但具有字、詞的線上檢索功能,還有篆刻、書法等線上藝術典藏,其中特別針對兩岸用詞差異...了解更多
瀏覽次數:32768
評分:
網路展書讀
因應電子書時代來臨,「網路展書讀」將中國文學及電腦科技結合,利用資訊科技,引出中國文學多樣化的風貌。
在網路展書讀網站,可以找到唐詩三百首、宋詞三百首等古典詩詞,也有紅樓夢、三...了解更多
瀏覽次數:2292
評分:
國立政治大學漢語口語語料庫
「國立政治大學漢語口語語料庫」包含三個語言的口語語料:中文、客語、閩南語。
語料庫記錄口語語料,並提供外界作為非營利的研究和教學之用。
學生和教師(或其他)經會員註冊啟用之後,即可免費使用...了解更多
瀏覽次數:3311
評分:
台大臺灣南島與多媒體語料庫
「臺大臺灣南島語語料庫」是由臺灣大學語言學研究所黃宣範、蘇以文及宋麗梅教授共同主持,結合了臺灣大學四個學院之八個系所的跨領域專業人才,以臺灣南島語為主軸,藉由資訊科技運用,建構起語言資...了解更多
瀏覽次數:1708
評分:
臺灣兒童語言語料庫
台灣兒童語言語料庫是由張顯達、張鑑如、柯華葳、蔡素娟四位老師的建置成果。
語料庫類型包含:親子共讀、親子對話、自發性對話、SLI(含對照組)。
年齡設定從一歲到八歲,可小至以月為單位。
...了解更多
瀏覽次數:2191
評分:
臺灣多國語言學習者語料庫系統
「成功大學多國語語料庫」是在台第二外語學習者與料庫,跨中、德、日、西語言的整合模式,涵蓋東西方不同語種、語言形式及語言特色的語料庫建構工作。
目的是以此語料庫為核心,進行不同層面的語言分...了解更多
瀏覽次數:1863
評分:
HSK動態作文語料庫
提供非母語寫作真實語料的檢索,包括留學生作文1萬餘篇,每篇標注字、詞、句、篇章等偏誤信息。
...了解更多
瀏覽次數:1899
評分:
跨地區、年代漢語成用字頻率統計
「香港、大陸、臺灣-跨地區、跨年代現代漢語成用字頻率統計」先後由何秀煌教授和關子尹教授主持。
網站的建置是根據「跨地區」和「跨年代」的理念去建立,為字頻研究開闢了新的領域,並透過不同單位...了解更多
瀏覽次數:1647
評分:
內閣大庫檔案
「內閣大庫檔案」是由中央研究院歷史語言研究所所藏。
使用者可免費使用,若需授權則再申請即可。
其檔案原藏於清宮內閣大庫,宣統元年(1909)因大庫整修而被移出。
清亡後幾經轉手,一度被賣入同...了解更多
瀏覽次數:1175
評分:
有聲媒體語言資源網
「中國傳媒大學有聲媒體文本語料庫」是一個開放、免費使用的語料庫。
語料庫包括2008至2013六年的34,039個廣播、電視節目的轉寫文本。
在檢索頁面的卷軸裡可進行語料選擇,進行特定時間...了解更多
瀏覽次數:1714
評分:
蘭開斯特漢語語料庫
蘭開斯特漢語語料庫(LCMC)是應學術界對免費對公眾開放的平衡的現代漢語語料庫的需求的情況下籌建的。
LCMC語料庫是由蘭開斯特大學語言學系承擔的並得到英國經社研究委員會資助的研究專...了解更多
瀏覽次數:1644
評分:
龍TheSheffieldCorpusofChinese
SheffieldCorpusofChinese(SCC)是一個歷時語料庫,內涵廣泛的充分標記的中國歷史文本,使用者可在網站中進行整體搜索和分析。
文本分成不同類型、流派和不同時間...了解更多
瀏覽次數:1264
評分:
中國漢英平行語料大世界
「中國漢英平行語料大世界」為文本語料庫,包含三大部分:魯迅小說、偉人作品、傳統典籍。
。
而偉人作品分類中,是為毛澤東和鄧小平的作品。
傳統典籍,則是從先秦典籍到文心雕龍、唐詩都有。
...了解更多
瀏覽次數:3073
評分:
語料庫在線
「語料庫在線」由教育部語言文字應用研究所架設,彙整了三個種語料庫:現代漢語語料庫、古代漢語語料庫、語料庫字詞索引。
使用者針對語料可以進行以下三種分析處裡:1.分詞和詞性標註2.漢語拼...了解更多
瀏覽次數:2910
評分:
LIVAC共時語料庫
LIVAC漢語共時語料庫由香港城市大學語言資訊科學研究中心開發和推展,暫提供1995年至1997年的語料,語料內容包含大量漢語具代表性報章語料。
此語料庫特點採用「共時性」視窗模式,分析...了解更多
瀏覽次數:1331
評分:
哈工大語言技術平臺共用資源
哈工大資訊檢索研究中心(HITCIR)對外共用資源並不免費對外開放,僅免費提供給「高校和科研院所」用於科學研究。
其語料資源包含:「哈工大資訊檢索研究中心漢語依存樹庫」和「哈工大資訊檢...了解更多
瀏覽次數:1431
評分:
NLPIR微博博主語料庫
「NLPIR微博博主語料庫100萬條」是北京理工大學網路搜索挖掘與安全實驗室張華平博士,從新浪微博、騰訊微博中透過公開蒐集與抽取獲得的。
深入進行微博計算的研究後,透過自然語言處理與資訊...了解更多
瀏覽次數:1319
評分:
NLPIR500萬條twitter內容語料庫
「NLPIRtwitter內容語料庫」是北京理工大學網路搜索挖掘與安全實驗室張華平博士,從twitter中透過公開蒐集與抽取獲得的。
深入進行微博計算的研究後,透過自然語言處理與資訊檢...了解更多
瀏覽次數:1348
評分:
多語言線上語料庫檢索平臺
「BFSUCQPweb多語言線上語料庫檢索平臺」(http://124.193.83.252/cqp/,用戶名:test,密碼:test)是由北京外國語大學中國外語教育研究中心的許...了解更多
瀏覽次數:1417
評分:
WenzhouSpokenCorpus
溫州口語語言資料庫
「溫州口語語料庫」是由阿爾伯塔大學語言學系的JingxiaLinandJohnNewman所建置,並由TextAnalysisforResearchPortal(T...了解更多
瀏覽次數:1017
評分:
字字珠璣
字字珠璣為中研院語言所架設的字詞搜尋網站,分為造詞搜尋、音韻搜尋及出處搜尋三種檢索方式,分別介紹如下:
1.造詞搜尋:在一般搜尋功能中鍵入漢字,即可查到包含該漢字的所有詞(例...了解更多
瀏覽次數:3491
評分:
粵語審音配詞字庫
粵語審音配詞字庫是一個專門針對粵語學習設計的網站,收錄《粵音韻彙》、《李氏中文字典》、《廣州話標準音字彙》及《粵音正讀字彙》四本書的資料,並且提供漢字、粵音等查詢功能,漢語方言學習者...了解更多
瀏覽次數:3303
評分:
中英雙語知識本體詞網
中英雙語知識本體詞網由中央研究院語言所架設,以英語WordNet架構與台灣地區語言使用經驗為基礎,提供中英雙語跨語言資訊轉換、語言資訊與概念架構的連結、詞義的區分及詞義關係連結等等,是...了解更多
瀏覽次數:1417
評分:
中央研究院語言典藏計畫
「語言典藏計畫」網站由中央研究院語言所設立,建構了先秦甲骨金文簡牘語料庫、上古漢語文獻標記語料庫、閩客語典藏、台灣國語口音之社會分佈典藏以及台灣南島語典藏五個語料庫,結合數位科技,保存...了解更多
瀏覽次數:2051
評分:
中文句結構樹資料
中文句結構資料庫為專業的句子結構資料大全,為中研院詞庫小組所建置,由中央研究院平衡語料庫中抽取句子,經由電腦及人工分析製成。
本資料庫可依關鍵詞及句型查詢,關鍵詞部分為複合...了解更多
瀏覽次數:1589
評分:
中文一詞泛讀與閱讀
本網站針對成人學習者設計,整理上古漢語語料庫、近代漢語語料庫、國立編譯館國小國語課本、唐詩三百首語料等,理念為「針對一詞廣泛閱讀」的學習模式,讓學習者可以針對一個詞語,大量閱讀出現該...了解更多
瀏覽次數:1641
評分:
古籍文獻資訊網
古籍文獻資訊網由國家圖書館建置,包含古籍影像檢索系統、古籍書目資料庫、金石拓片資料庫等等,資源豐富完整,查詢方便。
網站主要分為資料庫查詢及特藏線上展覽館兩大類,分別簡介如下:
...了解更多
瀏覽次數:1230
評分:
現代漢語平衡語料庫
現代漢語平衡語料庫由中研院資訊所及與語言所建置,專門針對語言分析而設計,收錄的文句皆依詞斷開並標示詞類,共有五百萬詞,專供語言研究使用。
使用語料庫時,首先於「自訂語料庫」設定...了解更多
瀏覽次數:1619
評分:
華語為第二語口語語料庫
這個語料庫由師大華研所建構,專門蒐集華語學習者的中介語語料。
目前以生語料庫的形式進行建置,語料資源來自2008年起參加國家華語測驗(TOP)的基礎級及進階級考生的口語錄音檔,以英日韓三...了解更多
瀏覽次數:2646
評分:
香港城市大學-共時語料庫
LIVAC共時語料庫由香港城市大學語言資訊科學研究中心設置,最大特點在採用共時性視窗模式,自1995年起,定時收集來自許多不同地方的定量同類語料,可供客觀比較研究使用。
首先,...了解更多
瀏覽次數:1739
評分:
學習者語料庫
學習者語料庫以華語學習者為對象,針對各種語言背景學習者的中介語做了語料整理,資料豐富,除了可找到多元背景的學習者語料,亦可搜尋到不同功能、文體的語料,對華語教學研究大有裨益。
...了解更多
瀏覽次數:1663
評分:
北大語料庫
北大語料庫由北京大學中國語言學研究中心建置,收錄了豐富的現代及古代漢語語料,共4.77億字,專供學術研究使用。
使用者於語料庫主頁選擇語料類型,並於搜索列鍵入關鍵字後,即可...了解更多
瀏覽次數:1783
評分:
常用詞首、詞尾字資料庫查詢
常用詞首、詞尾字資料庫根據中研院平衡語料庫,收集常用名詞及動詞的詞首及詞尾,總計4025筆資料,研究者可在此者到完整豐富的相關資料,節省自行整理所費時間。
本資料庫搜索方式...了解更多
瀏覽次數:1533
評分:
中文詞彙網路
中文詞彙網路(CWN)為中研院語言所設立的詞彙整理網站,以中頻詞為主,目前收錄5600個詞形及13160種詞義,目的在提供完整的中文詞義區分資料,是詞彙學習的珍貴資源庫。
網站...了解更多
瀏覽次數:5857
評分:
Jukuu句酷
Jukuu句酷於2004年由北京郵電大學創立,是一個蒐羅了上千萬條例句的雙語搜尋引擎,主要設計理念為「以搜索解決翻譯」,除了期望解決非母語者翻譯時常見的語法詞彙問題,亦嘗試以例句對照的...了解更多
瀏覽次數:3100
評分:
LCMC
LCMC是一個綜合性的漢語語料網站,提供豐富的漢語語料庫資源,並整理出頻率統計資料,可供相關研究使用。
網站操作方式簡單,亦附有英語版的使用解說,相當方便。
兩大功能分別簡介如下:
...了解更多
瀏覽次數:1492
評分:
北京口語語料查詢系統
北京口語語料查詢系統為北京語言大學語言研究所建置,供漢語研究者使用。
其檢索功能多樣,可以單詞為單位,也能以句式為檢索目標,例如於「檢索詞1」及「檢索詞2」中輸入不同的單詞,即可找到口...了解更多
瀏覽次數:1816
評分:
中華文本庫
為一個華語的文本資料庫,提供大量多方面的簡體中文文本參考資料,如科學研究、教學教案、IT技術、備考資料、辦公文本、科技文本以及考試文本,除以類型搜尋文本,亦可以透過關鍵字搜尋,極具便...了解更多
瀏覽次數:1766
評分:
CCL語料庫檢索
CCL語料庫及其檢索系統為純學術非盈利性。
語料庫僅供語言研究參考之用。
語料本身的正確性需要加以核實。
語料庫中的中文文本未經分詞處理。
檢索系統以漢字為基本單位。
主要功能特色:支援複雜檢...了解更多
瀏覽次數:1083
評分:
TOCFL學習者語料檢索系統
TOCFL學習者語料檢索系統蒐集了母語非華語的外籍人士,從2006到2012年期間所寫的作文,共4567篇,約150萬字。
其中2837篇經過偏誤標記處理,可以讓華語教師歸納偏誤,進而幫...了解更多
瀏覽次數:1652
評分:
LingoHut
Lingo主要給學習者提供詞彙學習資源,從日常生活到專門學術的詞彙(共109課)。
除了詞彙列表之外,Lingohut還提供很多詞彙遊戲讓學習可以重復練習自己所學過的詞彙。
例如:Fl...了解更多
瀏覽次數:1013
評分:
延伸文章資訊
- 1以中文十億詞語料庫為基礎之兩岸詞彙對比研究 - ACL Anthology
同概念詞彙的使用狀況。本文進一步使用中文概念辭典與中文詞網所使用的詞彙,在. Gigaword Corpus 中繁體語料與簡體語料的相對使用率,探究兩岸對於使用相同詞彙,.
- 2現代漢語平衡語料庫 - CKIP Lab 中文詞知識庫小組
中央研究院漢語平衡語料庫(簡稱Sinica Corpus)是世界上第一個有完整詞類標記的漢語平衡語料庫。由於加詞類標記的漢語語料庫是史無前例的嘗試,第一步先以較小規模(但 ...
- 3中文NLP福利!大規模中文自然語言處理語料 - 人人焦點
【新智元導讀】本文介紹一個中文自然語言處理語料庫項目:nlp_chinese_corpus ,初步貢獻了幾個已經預處理好的中文語料,包括維基、新聞和百科語料, ...
- 4語料庫與華語教學 - 政治大學
使用語料庫來學習中文的. ○ 同義詞 ... 語料庫與語言教學專書(From Corpus to ... 2009 年1月14日韓國大學華語教師研修課程. 語料庫之五大用途. ○ 語言教學.
- 5政治大學中文口語語料庫
NCCU Corpus of Spoken Taiwan Mandarin. 政治大學中文口語語料庫. Home · About the corpus · Corpus data · Stati...