综合精品天天夜夜久久,日本中文字幕二区区精品,亚洲欧美中文字幕制服二区,青青青国产爽爽视频免费观看

        中國(guó)基因網(wǎng)您的位置:首頁(yè) >基因檢測(cè) >

        研究發(fā)現(xiàn)基因組數(shù)據(jù)庫(kù)的增長(zhǎng)會(huì)影響物種的準(zhǔn)確性

        有許多方法可以切割和切割基因組數(shù)據(jù)以識(shí)別一種細(xì)菌,或者至少找到它的近親。但萊斯大學(xué)的一位計(jì)算機(jī)科學(xué)家表示,對(duì)基因組進(jìn)行測(cè)序的快速技術(shù)已經(jīng)充斥著公共數(shù)據(jù)庫(kù)并且以一種偏見(jiàn)的方式,包含了許多關(guān)于某些物種的基因組數(shù)據(jù),而對(duì)其他物種則不夠。

        研究發(fā)現(xiàn)基因組數(shù)據(jù)庫(kù)的增長(zhǎng)會(huì)影響物種的準(zhǔn)確性

        Todd Treangen及其同事測(cè)試了分類(lèi)學(xué)分類(lèi)方法,這些方法將目標(biāo)細(xì)菌的基因組序列與大型數(shù)據(jù)庫(kù)中記錄的基因組序列進(jìn)行匹配,以識(shí)別物種。在此過(guò)程中,他們制定了提高準(zhǔn)確性和靈敏度的途徑。

        Treangen是本月發(fā)表在Genome Biology上的一項(xiàng)研究的資深作者,該研究表明,在一個(gè)廣泛使用的聯(lián)邦數(shù)據(jù)庫(kù) -國(guó)家生物技術(shù)信息中心的RefSeq中,隨時(shí)間的變化如何影響了宏基因組分類(lèi)方法的準(zhǔn)確性。

        宏基因組學(xué)專(zhuān)家Treangen(環(huán)境樣品遺傳物質(zhì)研究)的主要關(guān)注點(diǎn)是保持快速鑒定對(duì)公眾健康構(gòu)成威脅的細(xì)菌的能力。

        大數(shù)據(jù)具有獨(dú)特的優(yōu)勢(shì),可以做到這一點(diǎn) - 但它有很多。他說(shuō),目前,低成本,高通量的DNA鳥(niǎo)槍測(cè)序機(jī)從微生物集合中讀取短DNA序列,每?jī)傻饺昃蜁?huì)使RefSeq 的基因組數(shù)據(jù)翻倍。

        “我最初認(rèn)為這些方法的數(shù)據(jù)總是更好,”Treangen說(shuō),他今年從馬里蘭大學(xué)高級(jí)計(jì)算機(jī)研究所加入賴(lài)斯。“你會(huì)期望沒(méi)有懲罰,因?yàn)閿?shù)據(jù)庫(kù)的增長(zhǎng)是好的。” 然而,研究人員發(fā)現(xiàn),RefSeq中的細(xì)菌數(shù)據(jù)在分類(lèi)層次的物種水平上具有巨大的影響,并且以驚人的速度增長(zhǎng)。

        對(duì)于將兩種常用技術(shù)結(jié)合起來(lái)以確定其發(fā)現(xiàn)的研究人員而言,這是一個(gè)問(wèn)題。一種稱(chēng)為基于k聚體的分類(lèi),其通過(guò)精確匹配鑒定來(lái)自細(xì)菌樣品中所有生物的短DNA序列。

        “大多數(shù)使問(wèn)題在計(jì)算上可行的方法依賴(lài)于k-mers,它們與長(zhǎng)度'k'完全匹配,或者是數(shù)據(jù)庫(kù)中包含的微生物的關(guān)鍵,”他說(shuō)。“如果順序讀取與數(shù)據(jù)庫(kù)中的某些內(nèi)容完全匹配,那么直覺(jué)就是你能夠以更高的精度說(shuō)明這是什么,并且更快捷的計(jì)算方法。”

        他說(shuō),一種常用的基于k-mer分類(lèi)的技術(shù)是最低共同祖先(LCA)分配。LCA將樣本與共享匹配的序列進(jìn)行比較,如果需要,將它們分配到分類(lèi)中的更高級(jí)別,例如屬而不是物種。但他說(shuō),對(duì)于試圖確定病原體的研究人員來(lái)說(shuō),這可能不夠具體。

        事實(shí)上,該研究發(fā)現(xiàn)了一種名為Bracken的基于k-mer的分類(lèi)工具,該工具使用貝葉斯統(tǒng)計(jì)來(lái)推斷序列的最佳匹配,有助于緩解不平衡。即便如此,它仍難以在數(shù)據(jù)庫(kù)中識(shí)別與近親相關(guān)的基因組,但不能完美匹配。

        Treangen說(shuō),對(duì)特定病原體的資金充足的研究是必要的,并且極大地幫助了快速爆發(fā)檢測(cè)和跟蹤,但它最終偏向像RefSeq這樣的公共數(shù)據(jù)庫(kù)。

        “例如,對(duì)食源性病原體存在巨大偏見(jiàn),”他說(shuō)。“社會(huì)希望對(duì)沙門(mén)氏菌有很多了解,這是理所當(dāng)然的。美國(guó)食品和藥物管理局,特別是GenomeTrakr,已經(jīng)幫助對(duì)數(shù)千種相關(guān)病原體進(jìn)行測(cè)序,并將它們直接添加到參考數(shù)據(jù)庫(kù)中。”

        然而,他說(shuō),將參考數(shù)據(jù)庫(kù)偏向特定屬和微生物家族的方式會(huì)影響使用k-mer和LCA方法的快速分類(lèi)學(xué)分類(lèi)工具(如Kraken)的準(zhǔn)確性和靈敏度。

        Treangen說(shuō)最近最好的假陽(yáng)性鑒定實(shí)例是一項(xiàng)最初報(bào)告紐約市地鐵炭疽細(xì)菌證據(jù)的研究。該研究基于來(lái)自樣本的測(cè)序基因組,后來(lái)進(jìn)行了修訂,以反映錯(cuò)誤識(shí)別序列為炭疽芽孢桿菌的錯(cuò)配。

        雖然對(duì)公共衛(wèi)生的關(guān)注是一個(gè)關(guān)鍵的優(yōu)先事項(xiàng),但Treangen說(shuō),需要能夠應(yīng)對(duì)數(shù)據(jù)庫(kù)增長(zhǎng)和噪聲的新技術(shù),以及增加序列基因組的廣度,以便在該領(lǐng)域持續(xù)改進(jìn)。“例如,來(lái)自土壤和海洋的微生物嚴(yán)重欠采樣,”他說(shuō)。“我們需要繼續(xù)排序以更好地填充公共數(shù)據(jù)庫(kù),這將最終有助于我們從復(fù)雜樣本中準(zhǔn)確分類(lèi)微生物的能力。”

        鄭重聲明:本文版權(quán)歸原作者所有,轉(zhuǎn)載文章僅為傳播更多信息之目的,如有侵權(quán)行為,請(qǐng)第一時(shí)間聯(lián)系我們修改或刪除,多謝。

        推薦內(nèi)容