資料檢索基礎

文章推薦指數: 80 %
投票人數:10人

資訊檢索是利用一定設備和方法, 從某種媒體上面的文獻、 資料或數據中查找所需資訊的一種過程。

因為個人資訊需求的不同, 資訊檢索的對象可以是圖書、 期刊、報紙、 學位 ... 基礎 圖書 新聞 論文 期刊 研究 專利 其他 .  資料檢索的基礎 資料的種類         現今是資料爆炸的時代,各種資料充斥,因此能夠搜尋資料、掌握適切的資訊便是成功的基礎,因此資訊的整理和提供便成為一種專門的行業,美國 InstituteofScientificInformation便是從販售CurrentContent 起家的。

        對本課而言,和生命科學相關的資訊可以劃分為︰   一、圖書資訊 二、新聞資訊 三、學位論文資訊 四、期刊和會議論文 五、研究計畫資訊 六、專利資訊 七、其他資訊            而本課便依次說明這些資料如何進行有效率的檢索。

檢索所得到的資料亦將是異常龐大,往後會介紹如何利用電腦軟體進行管理。

  檢索步驟          就如同本課的作業,要蒐集某個研究主題的文獻、針對生命科學相關新聞主題的報導等,這些都是先有特定主題,是由認課教師指定的,當進行研究或往後就業工作時,主題尋找本身就是展現學養能力之一。

當決定主題後時 ,必須決定找尋的途徑,決定找尋的範圍及方向, 也就是產生 檢索策略,其中包括:檢索系統的選定、檢索詞的確認、檢索技巧的應用 到展現的結果等一完整的思考規劃。

        進行檢索時的基本步驟有:  (1)決定檢索關鍵詞Keywords (2)決定檢索工具  (3)檢索方式  (4)利用檢索技巧  (5)結果的獲取  決定檢索關鍵詞  關鍵詞(Keywords)就是用來檢索的重要檢索詞,可以由一個或多個字組合而成 。

    單一詞彙 只要在搜尋引擎的檢索欄位輸入您想找尋資料的關鍵字, 搜尋引擎會依據這個關鍵詞幫您查找了。

例如:hepatitis(肝炎),enterovirus(腸病毒), Vibrio(弧菌)等。

一個以上的詞彙 如果有二個以上的詞彙,可以利用布林邏輯或是其他策略將它們 結合起來 。

例如:要找大腸桿菌的腸毒素(enterotoxin ofEscherichiacoli),可以設定enterotoxin(腸毒素)和 coli兩個辭彙。

  一句完整的話語  也可以直接輸入一句完整的話語,Foodborne poisoningoutbreakinUnitedStates。

  如果選定Escherichiacoli 為關鍵字,會得到難於處理的大量資料,這時候就需要多設定用以選擇(限制)的檢索詞,例如年份、主題(如O157:H7)等。

資訊的檢索            資訊檢索是利用一定設備和方法,從某種 媒體上面的文獻、資料或數據中查找所需 資訊的一種過程。

因為個人資訊需求的不 同,資訊檢索的對象可以是圖書、期刊 、報紙、學位論文、會議論 文、研究資訊、專利資訊等。

        在檢索的過程中,將就"關鍵字"、 "標題"及"欄位" 三個方面來會合在策略中,以提升檢索效率論。

  以關鍵字進行檢索       關鍵字是最常用的檢索策 略,可以利用單字或辭彙找到在書刊名、 篇名、或其他欄位中出現相同單字或辭彙 的資料。

當我們做關鍵字檢索時,等於是 告訴資料庫去找全部資料中有出現關鍵字 的所有記錄。

所以,我們所用的關鍵字就 決定了檢索結果的好壞。

 用關鍵字 檢 索要得到滿意的結果,必須注意下面幾個 原則:  (1)準確︰選 用涵蓋主要主題概念的詞彙我們選擇的關 鍵字要能正確傳達研究主題的中心概念。

關鍵字必須能清楚地界定研究主題,選用 意義明確的字彙 ,例如要查食品中毒菌,就不要用germs (病菌)這麼一個通俗的字眼,最好能夠foodpoisoning bacteria,或用與主題更直接的關鍵詞,如某致病菌(Escherichia coli)。

  (2)不要太長︰選 用單字或簡短的片語關鍵字在進行檢索時 ,系統是到資料庫中去比對我們所輸入的 字彙,如果我們輸入的片語或詞組愈長, 找到完全吻合的機率就愈小,因為作者並 不見得就剛好用我們所輸入的片語或詞組 來作搜尋。

例如:不要用"Foodpoisoning outbreaksinTaiwan",而應該以"Foodpoisoningin Taiwan"來進行檢索。

  (3)專用辭彙︰選 用各學科的專門用語來檢索各學科的資料 庫當我們檢索的是專科資料庫(subject-specific database)時,不能用一般性的單字來作關鍵 字,此時必須參考資料庫裡的專門術語 。

     除此之外,我們還可以利用布林邏輯來組 合關鍵字,以擴大或縮小檢索範圍。

 利用布林邏輯 Boolean Searching    布林邏輯組合關鍵字(keywords)用以擴大 或縮小檢索範圍的技巧。

這是最常被讀者 使用的限制欄位檢索法,同時也是需多資 料庫都有提供的檢索運算方式。

常見的運 算元有下面三種︰  . AND  以大腸桿菌和腸毒素為例,假若我們要尋找有關大腸桿菌腸毒素的文章,我們需要使用 AND 要把這二個概念相結合,此時所要檢索的 是︰Escherichiacoli ANDenterotoxin,同時包含 這二個概念的文章才是我們所要的資料。

假如我們要找的是O157:H7的資料,大可以把三者相連, 如︰Escherichiacoli ANDenterotoxinANDO157。

. OR  以大腸桿菌細胞毒素為例,的英文名稱︰Shiga-liketoxin 、Verotoxin,前者是美國人先用,後者是英國人先用,其實都是一樣指在大腸桿菌中所產生類似赤痢菌細胞毒素的毒素。

當我們要盡量找全這些大腸桿菌細胞毒素有關的文獻時,最好採用 OR相連︰Shiga-liketoxinORVerotoxin,所要檢索的是只 要有包含這二個概念的其中一個,就是我 們所要的資料。

  . NOT  弧菌屬(Vibrio)中主要的人類病原菌有霍亂弧菌(Vibrio cholerae)、腸炎弧菌(Vibrioparahaemolyticus)和創傷弧菌(Vibrio vulnificus)等,不過也有其他菌種零星地造成一些疾病,所以可以使用 NOT聯合Vibrio 這幾種菌名,就會查到這三種以外的弧菌,如︰Vibrio NOTcholeraeNOTparahaemolyticusNOTvulnificus。

 利用切截 Truncation        有些資料庫允許我們利用 切截方式來查檢結尾不同的字彙,來擴大 檢索範圍。

例如,我們只要輸入compos?或 compos*就可以一次找到下列這一組字的結果 :compose/comosed/composition/composer等。

大部份的資 料庫都提供這種檢索技巧,但是所使用的 指令不見得每一個資料庫都相同,使用時 必須參考檢索說明或手冊。

更重要的是要 謹慎使用切截,確定所選的字根是最適當 的,不確定時翻一下手邊的英文字典。

試 想,如果查檢com?會得到什麼樣的結果?! 有些資料庫系統會自動做切截(truncation ),找出同樣字根的字彙。

有些資料庫的 關鍵字查檢的是title,有些則包括摘要,這 些也都會影響檢索結果。

查看help,了解資 料庫的預設方式,可以幫助我們構建更有 效的檢索策略。

   以 標題進行檢索          分類是以數字或 文數字的組合來表示圖書資料的內容,而 且為了要兼負排架的功能,所以每本書只 有一個分類號。

但是每本書的內容精雜不 一,有些書的內容焦點集中,一個適當的 分類號就能完整適切地涵蓋其內容,但是 更多的情況是一書涵蓋多個主題,這是一 個分類號就無精確地表達其內容了。

圖書 館為了幫助讀者能更方便、更精確地找到 所需要的圖書資料,提供讀者另一項檢索 點,那就是標題。

標題是以文字的方式來 表達一個概念,基本上是較符合人類的思 考模式,也比較貼近人類的資訊尋求行為 ,而且一本書如果涵蓋多個概念或主題時 ,我們可以用多個標題來表示。

            標題的使用可以使檢索結果更為精確,但 是通常因為不瞭解標題的組成及使用方式 ,因此使用標題檢索的人大大低於使用關 鍵字檢索的人。

所以,接下來就讓我們來 看看標題的便捷功能:中文圖書標題表是 根據美國國會圖書館標題表(LibraryCongress SubjectHeading,LCSH)修訂而來的。

首先,就讓我 們來了解一下中文圖書標題的組成吧!             標題可能由一個詞或多個詞所組成︰ (1)一個詞的標題通常是一個名詞,例如: Biotechnology、           Mycology;  (2)兩個詞組成的標題通常包含一個形容 詞和一個名詞,           例如︰MicrobialEcology、ClinicalMicrobiology;  (3)如果包含地理名稱,例如LakeErie會為了 彰顯地名而變             成Erie,Lake;  (4)超過兩個字以上,就可能包含連接 詞和介係詞,例如            Technologyandcivilization或Photographyofbirds等   複分Subdivisions          複分,就是縮小 檢索範圍,大致有下面幾種複分方式 :  (1)主 題複分TopicSubdivisions,例如:中等教育-教學 法,-就是在主題下根據不同的次主題細 分,使資料更為精確。

  . (2)形 式複分FormSubdivisions,形式就是指不同的媒體 ,例如:書本或期刊等等...大致會以下 面這種形式呈現:美國-歷史-連續性出版 品。

. (3)地理複分GeographicSubdivisions,即某個主題 在特定地點的資料,如:哲學-德國;或 某地的特定主題,如:阿根廷-歷史3.以 欄位進行檢索這是最簡單的一個檢索方式 ,通常資料庫的操作介面就將每個欄位列 出,其中的欄位包括:題名、著者、分類 號、作者號、出版項、ISBN號碼、叢書名.. .等。

    top      . 參考資料︰輔仁大學圖書資訊利用教育網 http://libteach.lins.fju.edu.tw/    



請為這篇文章評分?