資料檢索基礎
文章推薦指數: 80 %
資訊檢索是利用一定設備和方法, 從某種媒體上面的文獻、 資料或數據中查找所需資訊的一種過程。
因為個人資訊需求的不同, 資訊檢索的對象可以是圖書、 期刊、報紙、 學位 ...
基礎
圖書
新聞
論文
期刊
研究
專利
其他
.
資料檢索的基礎
資料的種類
現今是資料爆炸的時代,各種資料充斥,因此能夠搜尋資料、掌握適切的資訊便是成功的基礎,因此資訊的整理和提供便成為一種專門的行業,美國
InstituteofScientificInformation便是從販售CurrentContent
起家的。
對本課而言,和生命科學相關的資訊可以劃分為︰
一、圖書資訊
二、新聞資訊
三、學位論文資訊
四、期刊和會議論文
五、研究計畫資訊
六、專利資訊
七、其他資訊
而本課便依次說明這些資料如何進行有效率的檢索。
檢索所得到的資料亦將是異常龐大,往後會介紹如何利用電腦軟體進行管理。
檢索步驟
就如同本課的作業,要蒐集某個研究主題的文獻、針對生命科學相關新聞主題的報導等,這些都是先有特定主題,是由認課教師指定的,當進行研究或往後就業工作時,主題尋找本身就是展現學養能力之一。
當決定主題後時
,必須決定找尋的途徑,決定找尋的範圍及方向,
也就是產生
檢索策略,其中包括:檢索系統的選定、檢索詞的確認、檢索技巧的應用
到展現的結果等一完整的思考規劃。
進行檢索時的基本步驟有:
(1)決定檢索關鍵詞Keywords
(2)決定檢索工具
(3)檢索方式
(4)利用檢索技巧
(5)結果的獲取
決定檢索關鍵詞
關鍵詞(Keywords)就是用來檢索的重要檢索詞,可以由一個或多個字組合而成
。
單一詞彙
只要在搜尋引擎的檢索欄位輸入您想找尋資料的關鍵字,
搜尋引擎會依據這個關鍵詞幫您查找了。
例如:hepatitis(肝炎),enterovirus(腸病毒),
Vibrio(弧菌)等。
一個以上的詞彙
如果有二個以上的詞彙,可以利用布林邏輯或是其他策略將它們
結合起來 。
例如:要找大腸桿菌的腸毒素(enterotoxin
ofEscherichiacoli),可以設定enterotoxin(腸毒素)和
coli兩個辭彙。
一句完整的話語
也可以直接輸入一句完整的話語,Foodborne
poisoningoutbreakinUnitedStates。
如果選定Escherichiacoli
為關鍵字,會得到難於處理的大量資料,這時候就需要多設定用以選擇(限制)的檢索詞,例如年份、主題(如O157:H7)等。
資訊的檢索
資訊檢索是利用一定設備和方法,從某種
媒體上面的文獻、資料或數據中查找所需
資訊的一種過程。
因為個人資訊需求的不
同,資訊檢索的對象可以是圖書、期刊
、報紙、學位論文、會議論
文、研究資訊、專利資訊等。
在檢索的過程中,將就"關鍵字"、
"標題"及"欄位"
三個方面來會合在策略中,以提升檢索效率論。
以關鍵字進行檢索
關鍵字是最常用的檢索策
略,可以利用單字或辭彙找到在書刊名、
篇名、或其他欄位中出現相同單字或辭彙
的資料。
當我們做關鍵字檢索時,等於是
告訴資料庫去找全部資料中有出現關鍵字
的所有記錄。
所以,我們所用的關鍵字就
決定了檢索結果的好壞。
用關鍵字 檢
索要得到滿意的結果,必須注意下面幾個
原則:
(1)準確︰選
用涵蓋主要主題概念的詞彙我們選擇的關
鍵字要能正確傳達研究主題的中心概念。
關鍵字必須能清楚地界定研究主題,選用
意義明確的字彙
,例如要查食品中毒菌,就不要用germs
(病菌)這麼一個通俗的字眼,最好能夠foodpoisoning
bacteria,或用與主題更直接的關鍵詞,如某致病菌(Escherichia
coli)。
(2)不要太長︰選
用單字或簡短的片語關鍵字在進行檢索時
,系統是到資料庫中去比對我們所輸入的
字彙,如果我們輸入的片語或詞組愈長,
找到完全吻合的機率就愈小,因為作者並
不見得就剛好用我們所輸入的片語或詞組
來作搜尋。
例如:不要用"Foodpoisoning
outbreaksinTaiwan",而應該以"Foodpoisoningin
Taiwan"來進行檢索。
(3)專用辭彙︰選
用各學科的專門用語來檢索各學科的資料
庫當我們檢索的是專科資料庫(subject-specific
database)時,不能用一般性的單字來作關鍵
字,此時必須參考資料庫裡的專門術語
。
除此之外,我們還可以利用布林邏輯來組
合關鍵字,以擴大或縮小檢索範圍。
利用布林邏輯 Boolean
Searching
布林邏輯組合關鍵字(keywords)用以擴大
或縮小檢索範圍的技巧。
這是最常被讀者
使用的限制欄位檢索法,同時也是需多資
料庫都有提供的檢索運算方式。
常見的運
算元有下面三種︰
.
AND
以大腸桿菌和腸毒素為例,假若我們要尋找有關大腸桿菌腸毒素的文章,我們需要使用
AND 要把這二個概念相結合,此時所要檢索的
是︰Escherichiacoli ANDenterotoxin,同時包含
這二個概念的文章才是我們所要的資料。
假如我們要找的是O157:H7的資料,大可以把三者相連,
如︰Escherichiacoli ANDenterotoxinANDO157。
.
OR
以大腸桿菌細胞毒素為例,的英文名稱︰Shiga-liketoxin
、Verotoxin,前者是美國人先用,後者是英國人先用,其實都是一樣指在大腸桿菌中所產生類似赤痢菌細胞毒素的毒素。
當我們要盡量找全這些大腸桿菌細胞毒素有關的文獻時,最好採用
OR相連︰Shiga-liketoxinORVerotoxin,所要檢索的是只
要有包含這二個概念的其中一個,就是我
們所要的資料。
.
NOT
弧菌屬(Vibrio)中主要的人類病原菌有霍亂弧菌(Vibrio
cholerae)、腸炎弧菌(Vibrioparahaemolyticus)和創傷弧菌(Vibrio
vulnificus)等,不過也有其他菌種零星地造成一些疾病,所以可以使用
NOT聯合Vibrio
這幾種菌名,就會查到這三種以外的弧菌,如︰Vibrio
NOTcholeraeNOTparahaemolyticusNOTvulnificus。
利用切截 Truncation
有些資料庫允許我們利用
切截方式來查檢結尾不同的字彙,來擴大
檢索範圍。
例如,我們只要輸入compos?或
compos*就可以一次找到下列這一組字的結果
:compose/comosed/composition/composer等。
大部份的資
料庫都提供這種檢索技巧,但是所使用的
指令不見得每一個資料庫都相同,使用時
必須參考檢索說明或手冊。
更重要的是要
謹慎使用切截,確定所選的字根是最適當
的,不確定時翻一下手邊的英文字典。
試
想,如果查檢com?會得到什麼樣的結果?!
有些資料庫系統會自動做切截(truncation
),找出同樣字根的字彙。
有些資料庫的
關鍵字查檢的是title,有些則包括摘要,這
些也都會影響檢索結果。
查看help,了解資
料庫的預設方式,可以幫助我們構建更有
效的檢索策略。
以
標題進行檢索
分類是以數字或
文數字的組合來表示圖書資料的內容,而
且為了要兼負排架的功能,所以每本書只
有一個分類號。
但是每本書的內容精雜不
一,有些書的內容焦點集中,一個適當的
分類號就能完整適切地涵蓋其內容,但是
更多的情況是一書涵蓋多個主題,這是一
個分類號就無精確地表達其內容了。
圖書
館為了幫助讀者能更方便、更精確地找到
所需要的圖書資料,提供讀者另一項檢索
點,那就是標題。
標題是以文字的方式來
表達一個概念,基本上是較符合人類的思
考模式,也比較貼近人類的資訊尋求行為
,而且一本書如果涵蓋多個概念或主題時
,我們可以用多個標題來表示。
標題的使用可以使檢索結果更為精確,但
是通常因為不瞭解標題的組成及使用方式
,因此使用標題檢索的人大大低於使用關
鍵字檢索的人。
所以,接下來就讓我們來
看看標題的便捷功能:中文圖書標題表是
根據美國國會圖書館標題表(LibraryCongress
SubjectHeading,LCSH)修訂而來的。
首先,就讓我
們來了解一下中文圖書標題的組成吧!
標題可能由一個詞或多個詞所組成︰
(1)一個詞的標題通常是一個名詞,例如:
Biotechnology、
Mycology;
(2)兩個詞組成的標題通常包含一個形容
詞和一個名詞,
例如︰MicrobialEcology、ClinicalMicrobiology;
(3)如果包含地理名稱,例如LakeErie會為了
彰顯地名而變
成Erie,Lake;
(4)超過兩個字以上,就可能包含連接
詞和介係詞,例如
Technologyandcivilization或Photographyofbirds等
複分Subdivisions
複分,就是縮小
檢索範圍,大致有下面幾種複分方式
:
(1)主
題複分TopicSubdivisions,例如:中等教育-教學
法,-就是在主題下根據不同的次主題細
分,使資料更為精確。
.
(2)形
式複分FormSubdivisions,形式就是指不同的媒體
,例如:書本或期刊等等...大致會以下
面這種形式呈現:美國-歷史-連續性出版
品。
.
(3)地理複分GeographicSubdivisions,即某個主題
在特定地點的資料,如:哲學-德國;或
某地的特定主題,如:阿根廷-歷史3.以
欄位進行檢索這是最簡單的一個檢索方式
,通常資料庫的操作介面就將每個欄位列
出,其中的欄位包括:題名、著者、分類
號、作者號、出版項、ISBN號碼、叢書名..
.等。
top
.
參考資料︰輔仁大學圖書資訊利用教育網 http://libteach.lins.fju.edu.tw/
延伸文章資訊
- 1裁判書查詢 - 司法院法學資料檢索系統
- 2Information Retrieval,簡稱IR - 資訊檢索 - 國家教育研究院雙語 ...
到了1960年的中期,由於電腦及其他機器的輔助,許多書本式的資料被轉換成為電腦可讀的形式,資訊檢索公然展開,圖書館開始利用批件(Batch)檢索的方式進行服務。
- 3司法院法學資料檢索系統 - Ex Libris 探索
- 4資訊檢索- 維基百科,自由的百科全書
資訊檢索(英語:Information Retrieval)是從資訊資源集合獲得與資訊需求相關的資訊資源的活動。搜尋可以基於全文或其他基於內容的索引。 自動資訊檢索系統用於減少 ...
- 5data retrieval - 資料檢索 - 國家教育研究院雙語詞彙
資料檢索. data retrieval. 2003年6月 資訊與通信術語辭典. 名詞解釋: 係從檔案、資料庫或儲存器中尋找和選取所需要的資料。