今年8月中旬,小銳與大家分享了2018年春夏期間,銳翌基因與合作伙伴發表SCI文章19篇,累計影響因子高達78.004
今天,小銳又要和大家分享一個好消息,銳翌新文再添一筆,我們的綜述性文章《人體腸道宏基因組生物信息分析方法》發表于2018年第11期《微生物學報》雜志上(DOI:10.13343/j.cnki.wsxb.20180110),文中分享了我們在宏基因組分析方面積累的經驗及對未來的展望,為生信分析的小伙伴們貢獻一份飽滿的干貨!
微生物學報
《微生物學報》創刊于1953年,是由中國科學院微生物研究所、中國微生物學會主辦的,以微生物學和應用基礎研究以及高技術創新為主的綜合性學術刊物,反映微生物學研究領域中最新成果,促進國內外學術交流。
《微生物學報》是我國微生物學領域綜合性學報級期刊和國家自然科學核心期刊。 被國內外一些著名的文摘刊物和數據庫收錄,是我國最早被世界最大醫學文獻數據庫“ MEDLARS”作為醫學主題詞標引的五個中文期刊之一,該刊發行和交換到40多個國家和地區。多次被評為優秀科技期刊,深受國內外廣大讀者的好評。
![]() |
我們的文章
![]() |
接下來,小銳給大家簡單介紹一下《人體腸道宏基因組生物信息分析方法》的內容(等不及想要細啃干貨的小伙伴可戳文末“閱讀原文”),該綜述由上海銳翌生物科技有限公司鄭智俊、黃云、秦楠撰寫,全面系統地概括了宏基因組生物信息常規分析方法和常用分析軟件,包括:
♥宏基因組物種注釋數據庫和序列比對軟件,如NCBI、HMP、GOLD等數據庫和SOAP、BWA和bowtie等軟件。
♥腸型的分類方法與可視化操作方法;流行的腸型的計算方法有兩種,一種是基于樣品間的 Jensen-Shannon距離,利用圍繞中心點劃分算法(PAM)進行聚類,或是直接基于物種豐度,利用狄利克雷多項混合模型(DMM)進行腸型分類,可視化主要是使用 R 軟件的‘ade4’包的類間分析、主成分分析或主坐標分析進行操作。
![]() |
腸型示意圖
♥樣本多樣性分析,包括分別描述單個樣本和樣本間差異的阿爾法多樣性與貝塔多樣性分析,常用分析方法分別是Shannon-Wiener 指數、系統發育多樣性全樹分析、Simpson 指數和Bray-Curtis 測量方法、加權/未加權的 UniFrac方法。
♥宏基因組組裝與基因集構建,常用基因預測軟件有MetaGeneMark,Glimmer-MG,MetaGene等。
♥差異基因分析,包括Wilcoxon 秩和檢驗、 Mann-Whitney U 檢驗和 Wilcoxon signed-rank檢驗等。
♥物種豐度計算,目前有兩種較為常用的計算物種多樣性的方法,一種是將測序所得到的宏基因組序列與全基因組序列進行比對,經計算后得到物種豐度表,另一種是用 MetaPhlAn2或 mOTU軟件將測序得到的宏基因組序列比對到標記序列
♥宏基因組功能分析的主要參考數據庫,包括包括京都基因與基因組百科全書 (KEGG)數據庫、EggNOG 數據庫、GO 數據庫等。
♥基因之間的關聯分析方法如斯皮爾曼等級相關系數和皮爾遜相關系數。
♥MGS和CAG分析,當樣品數量足夠多時,應用這兩種分析方法可以找到一些新物種。
♥醫學分類器,利用markers標記物可以構建疾病監測和診斷模型,分類常用算法包括Logistictic 回歸、 Support Vector Machine(SVM)、 Random Forest、人工神經網絡、樸素貝葉斯等,分類評價指標主要包括準確率、錯誤率、靈敏度、特異度、精度、MCC、 ROC等。