基準(zhǔn)計(jì)算宏基因組的方法
它們無(wú)處不在,但肉眼看不見。微生物是碳循環(huán)等關(guān)鍵環(huán)境過(guò)程監(jiān)管背后看不見的,有影響力的力量,但其中大部分仍然未知。十多年來(lái),美國(guó)能源部聯(lián)合基因組研究所(DOE JGI),DOE科學(xué)用戶設(shè)施辦公室,一直致力于研究人員使用最先進(jìn)的技術(shù)研究無(wú)法在實(shí)驗(yàn)室中生長(zhǎng)的未培養(yǎng)微生物。諸如環(huán)境群落的高通量基因組測(cè)序(“宏基因組學(xué)”)和開發(fā)用于揭示和表征來(lái)自環(huán)境的微生物群落的計(jì)算工具的方法。要解決將宏基因組聚集成一組重疊的DNA片段,這些片段一起代表DNA或重疊群的共有區(qū)域,然后將這些重疊群合并到基因組區(qū)域中,
2017年10月2日發(fā)表在Nature Methods上的一個(gè)團(tuán)隊(duì),包括DOE JGI研究人員描述了宏基因組解釋關(guān)鍵評(píng)估(CAMI)挑戰(zhàn)的結(jié)果,這是有史以來(lái)第一次,社區(qū)組織的宏基因組計(jì)算工具基準(zhǔn)評(píng)估。CAMI挑戰(zhàn)賽由比勒費(fèi)爾德大學(xué)計(jì)算宏基因組學(xué)團(tuán)隊(duì)負(fù)責(zé)人Alexander Sczyrba和前任DOE JGI博士后研究員以及Helmholtz感染研究中心感染研究實(shí)驗(yàn)室計(jì)算生物學(xué)負(fù)責(zé)人Alice McHardy領(lǐng)導(dǎo)。
“研究人員很難根據(jù)方法論文的結(jié)果找出用于特定數(shù)據(jù)集和分析的程序,”McHardy說(shuō)。“評(píng)估中使用的數(shù)據(jù)集和評(píng)估指標(biāo)差別很大。另一個(gè)問(wèn)題是開發(fā)人員在評(píng)估新型軟件的性能時(shí),通常會(huì)花費(fèi)大量時(shí)間對(duì)最新技術(shù)進(jìn)行基準(zhǔn)測(cè)試.CAMI希望改變這些事情,讓社區(qū)參與確定評(píng)估的標(biāo)準(zhǔn)和最佳實(shí)踐,并將這些原則應(yīng)用于基準(zhǔn)挑戰(zhàn)。“
CAMI挑戰(zhàn)賽于2015年進(jìn)行了三個(gè)多月。為了評(píng)估計(jì)算工具,組織者開發(fā)了3個(gè)模擬的宏基因組數(shù)據(jù)集,使用了由DOE JGI測(cè)序和組裝的300多個(gè)細(xì)菌和古菌分離株的基因組,這些基因組是基因組百科全書的一部分。最近在Nature Biotechnology上發(fā)表的細(xì)菌和古菌項(xiàng)目。這些基因組與CAMI Challenges聯(lián)盟共享,然后向公眾發(fā)布,以促進(jìn)不同工具的客觀基準(zhǔn)測(cè)試。這些數(shù)據(jù)集還包括來(lái)自德國(guó)科隆馬克斯普朗克研究所的相同數(shù)量的基因組,以及圓形元素和病毒。模擬數(shù)據(jù)集是150億個(gè)堿基(Gb)的單個(gè)樣本數(shù)據(jù)集,40個(gè)基因組和20個(gè)圓形元素的40 Gb數(shù)據(jù)集,以及包含數(shù)百個(gè)基因組和圓形元素的5個(gè)樣本組成的75 Gb時(shí)間序列數(shù)據(jù)集。
“JGI對(duì)工具和技術(shù)的基準(zhǔn)測(cè)試非常感興趣,這些工具和技術(shù)將推動(dòng)宏基因組的分析并提高我們?yōu)橛脩籼峁┑臄?shù)據(jù)質(zhì)量。發(fā)表了關(guān)于使用模擬數(shù)據(jù)集進(jìn)行宏基因組工具基準(zhǔn)測(cè)試的第一項(xiàng)研究。 JGI,很高興看到這種方法多年來(lái)如何擴(kuò)展,現(xiàn)在通過(guò)這項(xiàng)研究,演變成該領(lǐng)域標(biāo)準(zhǔn)化社區(qū)工作的模型,“能源部JGI原核計(jì)劃超級(jí)項(xiàng)目負(fù)責(zé)人Nikos Kyrpides說(shuō)。
DOE JGI微生物基因組學(xué)負(fù)責(zé)人Tanja Woyke補(bǔ)充說(shuō):“JGI不僅在實(shí)驗(yàn)室協(xié)議基準(zhǔn)測(cè)試方面,而且還在計(jì)算工作流程方面。”“這使我們參與像CAMI這樣重要的社區(qū)工作非常重要。”
有超過(guò)40個(gè)團(tuán)隊(duì)報(bào)名參加挑戰(zhàn)賽,CAMI組織者收到了來(lái)自全球25個(gè)項(xiàng)目的215份提交,但只有17個(gè)團(tuán)隊(duì)愿意發(fā)布他們的軟件實(shí)施。CAMI組織者評(píng)估了3個(gè)類別的計(jì)算工具。在裝配基因組時(shí)評(píng)估了六個(gè)裝配工和裝配管道短讀序列技術(shù)產(chǎn)生的序列。在分箱挑戰(zhàn)中,根據(jù)標(biāo)準(zhǔn)評(píng)估了五個(gè)基因組結(jié)合物和4個(gè)分類學(xué)結(jié)合物,包括工具在恢復(fù)個(gè)體基因組方面的功效。最后,評(píng)估了10個(gè)具有不同參數(shù)設(shè)置的分類學(xué)分析器,以評(píng)估它們?nèi)绾晤A(yù)測(cè)微生物和環(huán)狀元素的身份和相對(duì)豐度?;鶞?zhǔn)測(cè)試結(jié)果可在https://data.cami-challenge.org/results上找到。
CAMI組織者已經(jīng)在計(jì)劃未來(lái)的基準(zhǔn)測(cè)試挑戰(zhàn),例如評(píng)估和幫助長(zhǎng)讀取測(cè)序技術(shù)的方法開發(fā)。“CAMI是一項(xiàng)持續(xù)的舉措,”Sczyrba指出。“我們目前正在進(jìn)一步自動(dòng)化基準(zhǔn)測(cè)試和比較結(jié)果可視化。我們邀請(qǐng)所有有興趣的人加入并與CAMI合作,提供計(jì)算宏基因組學(xué)工具包的綜合性能概述,以告知開發(fā)人員當(dāng)前計(jì)算宏基因組學(xué)和應(yīng)用科學(xué)家的挑戰(zhàn)適合他們研究問(wèn)題的軟件。“
推薦內(nèi)容
-
在腫瘤中起作用的進(jìn)化新基因
彼得大帝圣彼得堡工業(yè)大學(xué)(SPbPU)的一組科學(xué)家研究了人類基因的進(jìn)化年齡,并確定了它們?cè)谀[瘤中表達(dá)的一類新基因-腫瘤特異性表達(dá)的進(jìn)化新(T
-
CRISPR基因切割可能提供繪制人類基因組圖的新方法
為了尋找對(duì)人類基因組進(jìn)行測(cè)序并讀取DNA關(guān)鍵變化的新方法,約翰霍普金斯大學(xué)醫(yī)學(xué)院的研究人員說(shuō),他們已經(jīng)成功地使用了基因切割工具CRISPR
-
用合成生物學(xué)建立循環(huán)生物經(jīng)濟(jì)學(xué)
2010年4月,墨西哥灣變黑。由深水地平線鉆井平臺(tái)上的甲烷氣體爆炸引發(fā)的最大海上石油泄漏應(yīng)該已經(jīng)泄漏了大約8億升石油進(jìn)入環(huán)境。造成墨西哥
-
瘧疾寄生蟲是通過(guò)雌性按蚊的叮咬傳播的
圖賓根大學(xué)的研究人員與生物技術(shù)公司Sanaria Inc 合作,在一項(xiàng)臨床試驗(yàn)中證明,在最后一劑疫苗接種后10周評(píng)估一種名為Sanaria PfSPZ-CVac
-
研究表明奶牛中的粘土補(bǔ)充劑可提高對(duì)黃曲霉毒素攻擊的免疫反應(yīng)
在抗黃曲霉毒素的斗爭(zhēng)中,乳制品生產(chǎn)者經(jīng)常轉(zhuǎn)向螯合劑如粘土,以減少毒素轉(zhuǎn)移到牛奶中。這是一種有效的策略,但伊利諾伊大學(xué)的一項(xiàng)新研...
-
中國(guó)研究人員進(jìn)一步開發(fā)腺嘌呤堿基編輯
來(lái)自華東師范大學(xué)和中國(guó)中山大學(xué)的兩個(gè)研究小組開發(fā)并改進(jìn)了小鼠和大鼠品系的ABE系統(tǒng),這對(duì)人類遺傳疾病和基因治療具有重要意義。該研究由S
-
細(xì)胞生物學(xué)中的誤導(dǎo)性圖像
光不能用于對(duì)小于其波長(zhǎng)一半的任何結(jié)構(gòu)進(jìn)行成像 - 長(zhǎng)期以來(lái),這被認(rèn)為是光學(xué)顯微鏡中的最終分辨率極限。然而,超分辨率顯微鏡的發(fā)展表明
-
KAIST推出增強(qiáng)型PDT治療癌癥副作用更少
KAIST研究小組開發(fā)了基于近紅外熒光團(tuán)的光動(dòng)力療法(PDT),減少了現(xiàn)有PDT的缺點(diǎn)。PDT是用激光治療傷口而不是藥物治療的一種方法。當(dāng)激光照射
-
跨越真菌生命樹的DNA修飾的新比較研究
DNA活性可以改變而不改變DNA片段本身的序列。基因激活和失活可以是物種如何產(chǎn)生獨(dú)特個(gè)體的基礎(chǔ)。在模式物種的背景下,很好地理解了一些改變
-
尾纖方法是基于該技術(shù)合成和測(cè)試大量尾纖類型的能力
抗生素耐藥性是一種快速發(fā)展的現(xiàn)象,給公共衛(wèi)生計(jì)劃人員造成了極大的頭痛。然而,一項(xiàng)新研究表明,使用一種稱為細(xì)菌噬菌體(簡(jiǎn)稱噬菌體)...