生物資訊實驗室- 研究群 - 中央研究院資訊科學研究所

文章推薦指數: 80 %
投票人數:10人

本實驗室的研究是以資訊技術應用在生物和醫學研究為主,針對不同生物體學(omics)上的生物學和生物醫學進行解析,主要研究可分成基因體和轉譯體研究,蛋白體及代謝體 ... 送出查詢 網站導覽 資訊所簡訊 卓越演講系列 關於本所 人員 研究群 研究概況 活動訊息 徵才 JISE 圖書室 資訊室 所內事務 首頁 FB粉絲團 RSS EN  首頁 研究群 生物資訊實驗室 研究群 友善列印 列印可使用瀏覽器提供的(Ctrl+P)功能 生物資訊實驗室 電腦系統實驗室 資料探勘與機器學習實驗室 多媒體技術實驗室 語言與知識處理實驗室 網路系統與服務實驗室 程式語言與形式方法實驗室 計算理論與演算法實驗室 生物資訊實驗室 ::: 研究人員 林仲彥Chung-YenLin(召集人) 宋定懿Ting-YiSung 蔡懷寬Huai-KuangTsai 施純傑ArthurChun-ChiehShih 博士後研究學者 張育榮Yu-JungChang 蔡郁偉Yu-WeiTsay 研究群介紹 本實驗室的研究是以資訊技術應用在生物和醫學研究為主,針對不同生物體學(omics)上的生物學和生物醫學進行解析,主要研究可分成基因體和轉譯體研究,蛋白體及代謝體研究兩大部份,分別詳述如下。

(1)基因體和轉譯體研究 處理巨量定序資料的方法論開發: 新世代定序技術已成為基因體和轉錄體研究的主要工具。

然而定序的資料量相當龐大,定序的序列也常有錯誤,因此在資料處理時,常造成記憶體不足和計算時間冗長等困擾,亟待解決。

因此,近年來我們致力於發展新的方法和開發新的工具來解決一連串計算的問題。

在次世代readmapping上,我們發展了一個極為快速的演算法Kart。

Kart將一個read分解成更小的碎片,並將其個別匹配到基因序列。

實驗結果證實Kart比一般mappers快三到十倍之多,而且錯誤容忍度及準確度均極高。

同樣的方法也可以應用在RNA-seq上,效果也甚佳。

在基因體組裝方面,我們設計一套以延伸為基礎的組裝程式(稱為JR-Assembler)利用整個短序做延伸,加快執行速度。

另外利用跨過小於序列長度的重複片段等方式來大幅降低記憶體的需求和執行時間,同時也考慮組裝的品質。

和其他程式比較,JR-Assembler的記憶體使用率和執行時間更有效率,而且保持良好的組裝品質,特別對於序長度等於及大於150bp的基因組資料。

處理巨量定序資料的工具和資訊整合平台開發: 我們發展Mapreduce平台的前組合和後組合分析技術,以預測序列片段的重複性和定序錯誤,來優化新穎基因體組合技術的正確性和效率(https://github.com/moneycat/QReadSelector)。

此外,我們也正在發展嶄新的雲端系統架構與演算法,將結合次世代與第三代單分子定序技術所產出之巨量資料,進一步加速新穎基因體組合器的執行效率與運用範疇。

在基因體組裝完成後,透過我們所建構基因結構解析註解流程、線上即時分析與呈現平台(http://molas.iis.sinica.edu.tw),已能整合基因體、轉錄體、蛋白質體與甲基化(http://tea.iis.sincia.edu.tw)等多維體資料,協同研究團隊以網頁介面,透過不同的角度來詮釋複雜生命現象的核心課題,如癌症臨床樣本、非模式生物(如龍膽石斑(http://molas.iis.sinica.edu.tw/grouper2016)、日本鰻(http://molas.iis.sinica.edu.tw/jpeel2016)與雞肉絲菇等)、環境微生物與人類病毒(Enterovirus,HCV)研究等,已協助找出罕見疾病之致病融合基因、建構高品質之非模式物種資料庫與找出限制HCV病毒複製的機制(PNAS,2017)等。

在複雜網路關鍵因子分析上,過去整合十一種拓樸分析之程式cytohubba(http://apps.cytoscape.org/apps/cytohubba),自2011年以來,已有超過9,000次的下載,近180次的文獻引用,而2017年一月上線的新版,至三月底,已有超過四百次的下載。

此外,所發展之多維體相關演算法已開始轉換到Galaxy平台介面,將以DOCKER或是VM影像檔方式散佈,以期讓生物學家、臨床研究人員和生物資訊學家可以輕易地獲得與整合這些工具,加速整體的研究流程。

轉錄因子和DNA結構的調控關係: 轉錄因子結合的預測由DNA序列與染色質通透性所決定,而後者通常受到染色質狀態與DNA結構特性所影響。

藉由同時考慮這些特徵,我們提出的隨機森林分類器在預測轉錄分子結合有顯著的改善。

接下來我們將進一步針對對於任何已定序之物種,單就其DNA序列來正確預測轉錄因子結合的可能區域。

在染色體的研究方面,我們發現非B型DNA結構在人類與老鼠中與選擇性剪接高度關聯,顯見結構妨礙在轉錄-剪接中扮演重要角色。

更進一步發現與DNA迴路有關的增強子,在老鼠中附近轉錄的eRNA極可能參與調控該增強子之目標基因。

(2)蛋白體及代謝體研究 蛋白體質譜實驗大數據分析: 質譜儀已成研究蛋白體學重要的實驗技術,質譜實驗有由下而上和由上而下兩類,前者是較常用的方式;我們針對此種實驗方式發展了計算方法和工具進行蛋白體定性及定量分析。

大規模帶醣的醣蛋白鑑定分析極具挑戰,故目前少有具此功能的工具。

為此,我們提出計算方法,並發展名為MAGIC的系統。

我們亦建構MAGIC-web的平台,處理大規模及標靶醣蛋白的鑑定。

在蛋白體定量方面,我們正將前已發表的定量工具Multi-Q,重新開發,以處理目前盛行的TMT10-plex定量實驗。

由上而下的質譜實驗方式,能完整偵測蛋白質上的修飾,故逐漸受到重視;唯其資料分析複雜,主要難在決定蛋白質的訊號群及其電荷。

我們提出一計算方法,名之為DYAMOND,並以此開發名為iTop-Q的分析軟體。

醣合成及代謝體之自動分析: 醣的合成技術雖然已臻成熟,然而複雜的實驗步驟,讓許多研究單位望之卻步。

為了減少這種嘗試、錯誤的實驗方法,我們發展了一套全自動的程式,將生物化學的種種限制因素考慮進來,預測出最佳的合成序列。

此外,我們在代謝體質譜資料分析上,發展定性與定量的計算方法,並完成定量工具,目前在開發定性軟體。

台灣癌症登月計畫:台灣於2016年八月受美國癌症研究所之邀,加入國際癌症登月計畫;其中一重要目標是進行癌症的蛋白基因體表徵分析。

我們針對早發及早期的肺癌進行研究,目前已知應和一些蛋白質的變異有關。

但從質譜大數據可靠地鑑定變異胜肽相當困難;我們目前正為此設計演算法。

我們也發展工具,幫助研究者選擇合適的水解酶分解蛋白質,以利產生合適長度的胜肽,質譜產生較好的訊號,而較有機會偵測變異胜肽。

此計畫採用TMT10-plex標記進行定量實驗,我們發展中的新版Multi-Q2軟體,將用來定量分析。

我們已展開肺癌病人檢體的質譜實驗數據分析,依美國癌症研究所的品管要求,每組病人資料必須鑑定出1萬個蛋白質,我們已能達到此要求。

同時,我們亦將針對這些質譜大數據進行變異胜肽的鑑定。

與國內外的合作單位: 生物資訊研究是跨領域研究,我們研究合作夥伴包含本院的農生中心、生物多樣性中心、化學所、統計所、分子生物研究所、細胞生物與個體生物研究所、植微所、和生醫所等,及院外的國衛院、台灣大學(醫學院、藥理所、病理研究所、生科院、漁科所和農業化學系)、台大醫院、成功大學生命科學院、海洋大學水產養殖系和水產試驗所等。

另外與國外的學術單位也有密切的合作計畫進行,包含美國密西根州立大學植物生物學研究所、加州大學洛杉磯分校醫學院、日本大阪大學蛋白質研究所和日本產業技術總合研究所等。

展開選單關閉選單 關於本所 簡介 歷年簡介 本所歷史 本所組織 所長的話 學術諮詢委員會 所務工作委員會 榮譽榜 聯絡資訊 交通資訊 人員 研究人員 合聘及兼任研究人員 研究技術人員 博士後研究人員 研究助理 國際研究生 訪問學人 退休暨離職研究人員 研究群 生物資訊實驗室 電腦系統實驗室 資料探勘與機器學習實驗室 多媒體技術實驗室 語言與知識處理實驗室 網路系統與服務實驗室 程式語言與形式方法實驗室 計算理論與演算法實驗室 研究概況 近期研究成果 著作目錄 研究計畫 合作計畫 重要研究成果 活動訊息 學術演講 近期消息與榮譽 卓越演講系列 學術研討會 徵才 誠徵博士後研究 誠徵研究及行政助理 誠徵研發替代役 暑期實習生 JISE 圖書室 本館導覽 最新消息 館藏查詢 電子資源 文獻傳遞服務 其他常用連結 個人借閱紀錄 技術報告 會議論文 所內專區 資訊室 簡介 資安通報 電腦與網路 帳號及電子郵件系統 電話系統 列印裝置 會議室及視訊會議 軟體及物品借領用 FAQ及其他 聯絡資訊 所內事務 人員需知 所內公告 行政業務 問題通報 線上申請、填報專區 IP與機房服務專區 所內服務系統 研究人員專區 管理專區



請為這篇文章評分?