综合精品天天夜夜久久,日本中文字幕二区区精品,亚洲欧美中文字幕制服二区,青青青国产爽爽视频免费观看

        中國基因網(wǎng)您的位置:首頁 >基因檢測 >

        科學(xué)家提出了一種更快 更準(zhǔn)確地研究DNA的算法

        來自德國,美國和俄羅斯的科學(xué)家團(tuán)隊(duì),包括MIPT生物信息學(xué)系主任Mark Borodovsky博士,提出了一種自動(dòng)搜索基因的算法,使其更有效率。新開發(fā)結(jié)合了最先進(jìn)的基因組數(shù)據(jù)工具的優(yōu)勢。這種新方法將使科學(xué)家能夠更快,更準(zhǔn)確地分析DNA序列,并識別基因組中的全套基因。

        科學(xué)家提出了一種更快 更準(zhǔn)確地研究DNA的算法

        盡管描述該算法的論文最近才出現(xiàn)在由牛津期刊出版的生物信息學(xué)期刊上,但已經(jīng)證明該方法非常受歡迎 - 計(jì)算機(jī)軟件程序已被全球1500多個(gè)不同的中心和實(shí)驗(yàn)室下載。該算法的測試表明它比其他類似算法準(zhǔn)確得多。

        該發(fā)展涉及生物信息學(xué)跨學(xué)科領(lǐng)域的應(yīng)用。生物信息學(xué)將數(shù)學(xué),統(tǒng)計(jì)學(xué)和計(jì)算機(jī)科學(xué)結(jié)合起來研究生物分子,如DNA,RNA和蛋白質(zhì)結(jié)構(gòu)。DNA基本上是一種信息分子,有時(shí)甚至以計(jì)算機(jī)化的形式描述(見圖1),以強(qiáng)調(diào)其作為生物記憶分子的作用。生物信息學(xué)是一個(gè)非常熱門的話題; 每個(gè)新的測序基因組都會引發(fā)許多額外的問題,科學(xué)家根本沒有時(shí)間回答這些問題。因此,自動(dòng)化流程是任何生物信息學(xué)項(xiàng)目成功的關(guān)鍵,這些算法對于解決各種各樣的問題至關(guān)重要。

        生物信息學(xué)最重要的領(lǐng)域之一是注釋基因組 - 確定哪些特定的DNA分子用于合成RNA和蛋白質(zhì)(見圖2)。這些部分 - 基因 - 具有重大的科學(xué)意義。事實(shí)上,在許多研究中,科學(xué)家并不需要有關(guān)整個(gè)基因組的信息(對于單個(gè)人類細(xì)胞約為2米長),而是關(guān)于其信息最豐富的部分 - 基因。通過搜索序列片段和已知基因之間的相似性,或通過檢測核苷酸序列的一致模式來鑒定基因部分。該過程使用預(yù)測算法來執(zhí)行。

        定位基因切片并非易事,特別是在真核生物中,除了細(xì)菌外,其中包括幾乎所有廣為人知的有機(jī)體類型。這是因?yàn)樵谶@些細(xì)胞中,遺傳信息的轉(zhuǎn)移由于編碼區(qū)(內(nèi)含子)中的“缺口”而變得復(fù)雜,并且因?yàn)闆]有明確的指標(biāo)來確定區(qū)域是否是編碼區(qū)。

        科學(xué)家提出的算法確定DNA中哪些區(qū)域是基因,哪些區(qū)域不是??茖W(xué)家使用馬爾可夫鏈,這是一系列隨機(jī)事件,其未來取決于過去的事件。在這種情況下,鏈的狀態(tài)是核苷酸或核苷酸詞(k-mers)。該算法確定基因組最可能的劃分為編碼區(qū)和非編碼區(qū),根據(jù)它們編碼蛋白質(zhì)或RNA的能力以最佳方式對基因組片段進(jìn)行分類。從RNA獲得的實(shí)驗(yàn)數(shù)據(jù)給出了額外的有用信息,其可用于訓(xùn)練算法中使用的模型。某些基因預(yù)測程序可以使用該數(shù)據(jù)來提高發(fā)現(xiàn)基因的準(zhǔn)確性。但是,這些算法需要對模型進(jìn)行特定類型的訓(xùn)練。對于AUGUSTUS軟件程序,例如,具有高水平的準(zhǔn)確性,需要訓(xùn)練基因組。這個(gè)集合可以使用另一個(gè)程序GeneMark-ET獲得 - 這是一種自我訓(xùn)練算法。這兩種算法結(jié)合在BRAKER1算法中,該算法由AUGUSTUS和GeneMark-ET的開發(fā)人員聯(lián)合提出。

        BRAKER1已經(jīng)證明了高效率。已開發(fā)的程序已被1500多個(gè)不同的中心和實(shí)驗(yàn)室下載。該算法的測試表明它比其他類似算法準(zhǔn)確得多。BRAKER1在單個(gè)處理器上的運(yùn)行時(shí)間為~17.5小時(shí),用于訓(xùn)練和預(yù)測長度為120兆堿基的基因組。考慮到使用并行處理器可以顯著減少這個(gè)時(shí)間,這是一個(gè)很好的結(jié)果,這意味著將來,算法可能更快,通常更有效。

        諸如此類的工具解決了各種問題。準(zhǔn)確地在基因組中注釋基因是非常重要的 - 例如全球1000基因組項(xiàng)目,其初步結(jié)果已經(jīng)發(fā)表。該項(xiàng)目于2008年啟動(dòng),涉及來自75個(gè)不同實(shí)驗(yàn)室和公司的研究人員。發(fā)現(xiàn)了稀有基因變異和基因取代的序列,其中一些可導(dǎo)致疾病。在診斷遺傳性疾病時(shí),了解基因切片中的哪些取代會導(dǎo)致疾病發(fā)展是非常重要的。該項(xiàng)目繪制了不同人群的基因組圖譜,注意到它們的編碼區(qū),并鑒定了罕見的核苷酸取代。將來,這將有助于醫(yī)生診斷心臟病,糖尿病和癌癥等復(fù)雜疾病。

        BRAKER1使科學(xué)家能夠有效地利用新生物的基因組,加快注釋基因組和獲取生命科學(xué)基本知識的過程。

        鄭重聲明:本文版權(quán)歸原作者所有,轉(zhuǎn)載文章僅為傳播更多信息之目的,如有侵權(quán)行為,請第一時(shí)間聯(lián)系我們修改或刪除,多謝。

        推薦內(nèi)容