综合精品天天夜夜久久,日本中文字幕二区区精品,亚洲欧美中文字幕制服二区,青青青国产爽爽视频免费观看

<optgroup id="41baq"></optgroup>

<form id="41baq"><rt id="41baq"></rt></form>

<form id="41baq"><sup id="41baq"></sup></form>

<dl id="41baq"></dl>

中國基因網(wǎng)您的位置：首頁 >基因檢測 >

科學(xué)家提出了一種更快更準(zhǔn)確地研究DNA的算法

2019-02-01 09:52:55 ? 來源：

來自德國，美國和俄羅斯的科學(xué)家團(tuán)隊(duì)，包括MIPT生物信息學(xué)系主任Mark Borodovsky博士，提出了一種自動(dòng)搜索基因的算法，使其更有效率。新開發(fā)結(jié)合了最先進(jìn)的基因組數(shù)據(jù)工具的優(yōu)勢。這種新方法將使科學(xué)家能夠更快，更準(zhǔn)確地分析DNA序列，并識別基因組中的全套基因。

盡管描述該算法的論文最近才出現(xiàn)在由牛津期刊出版的生物信息學(xué)期刊上，但已經(jīng)證明該方法非常受歡迎 - 計(jì)算機(jī)軟件程序已被全球1500多個(gè)不同的中心和實(shí)驗(yàn)室下載。該算法的測試表明它比其他類似算法準(zhǔn)確得多。

該發(fā)展涉及生物信息學(xué)跨學(xué)科領(lǐng)域的應(yīng)用。生物信息學(xué)將數(shù)學(xué)，統(tǒng)計(jì)學(xué)和計(jì)算機(jī)科學(xué)結(jié)合起來研究生物分子，如DNA，RNA和蛋白質(zhì)結(jié)構(gòu)。DNA基本上是一種信息分子，有時(shí)甚至以計(jì)算機(jī)化的形式描述(見圖1)，以強(qiáng)調(diào)其作為生物記憶分子的作用。生物信息學(xué)是一個(gè)非常熱門的話題; 每個(gè)新的測序基因組都會引發(fā)許多額外的問題，科學(xué)家根本沒有時(shí)間回答這些問題。因此，自動(dòng)化流程是任何生物信息學(xué)項(xiàng)目成功的關(guān)鍵，這些算法對于解決各種各樣的問題至關(guān)重要。

生物信息學(xué)最重要的領(lǐng)域之一是注釋基因組 - 確定哪些特定的DNA分子用于合成RNA和蛋白質(zhì)(見圖2)。這些部分 - 基因 - 具有重大的科學(xué)意義。事實(shí)上，在許多研究中，科學(xué)家并不需要有關(guān)整個(gè)基因組的信息(對于單個(gè)人類細(xì)胞約為2米長)，而是關(guān)于其信息最豐富的部分 - 基因。通過搜索序列片段和已知基因之間的相似性，或通過檢測核苷酸序列的一致模式來鑒定基因部分。該過程使用預(yù)測算法來執(zhí)行。

定位基因切片并非易事，特別是在真核生物中，除了細(xì)菌外，其中包括幾乎所有廣為人知的有機(jī)體類型。這是因?yàn)樵谶@些細(xì)胞中，遺傳信息的轉(zhuǎn)移由于編碼區(qū)(內(nèi)含子)中的“缺口”而變得復(fù)雜，并且因?yàn)闆]有明確的指標(biāo)來確定區(qū)域是否是編碼區(qū)。

科學(xué)家提出的算法確定DNA中哪些區(qū)域是基因，哪些區(qū)域不是?？茖W(xué)家使用馬爾可夫鏈，這是一系列隨機(jī)事件，其未來取決于過去的事件。在這種情況下，鏈的狀態(tài)是核苷酸或核苷酸詞(k-mers)。該算法確定基因組最可能的劃分為編碼區(qū)和非編碼區(qū)，根據(jù)它們編碼蛋白質(zhì)或RNA的能力以最佳方式對基因組片段進(jìn)行分類。從RNA獲得的實(shí)驗(yàn)數(shù)據(jù)給出了額外的有用信息，其可用于訓(xùn)練算法中使用的模型。某些基因預(yù)測程序可以使用該數(shù)據(jù)來提高發(fā)現(xiàn)基因的準(zhǔn)確性。但是，這些算法需要對模型進(jìn)行特定類型的訓(xùn)練。對于AUGUSTUS軟件程序，例如，具有高水平的準(zhǔn)確性，需要訓(xùn)練基因組。這個(gè)集合可以使用另一個(gè)程序GeneMark-ET獲得 - 這是一種自我訓(xùn)練算法。這兩種算法結(jié)合在BRAKER1算法中，該算法由AUGUSTUS和GeneMark-ET的開發(fā)人員聯(lián)合提出。

BRAKER1已經(jīng)證明了高效率。已開發(fā)的程序已被1500多個(gè)不同的中心和實(shí)驗(yàn)室下載。該算法的測試表明它比其他類似算法準(zhǔn)確得多。BRAKER1在單個(gè)處理器上的運(yùn)行時(shí)間為~17.5小時(shí)，用于訓(xùn)練和預(yù)測長度為120兆堿基的基因組。考慮到使用并行處理器可以顯著減少這個(gè)時(shí)間，這是一個(gè)很好的結(jié)果，這意味著將來，算法可能更快，通常更有效。

諸如此類的工具解決了各種問題。準(zhǔn)確地在基因組中注釋基因是非常重要的 - 例如全球1000基因組項(xiàng)目，其初步結(jié)果已經(jīng)發(fā)表。該項(xiàng)目于2008年啟動(dòng)，涉及來自75個(gè)不同實(shí)驗(yàn)室和公司的研究人員。發(fā)現(xiàn)了稀有基因變異和基因取代的序列，其中一些可導(dǎo)致疾病。在診斷遺傳性疾病時(shí)，了解基因切片中的哪些取代會導(dǎo)致疾病發(fā)展是非常重要的。該項(xiàng)目繪制了不同人群的基因組圖譜，注意到它們的編碼區(qū)，并鑒定了罕見的核苷酸取代。將來，這將有助于醫(yī)生診斷心臟病，糖尿病和癌癥等復(fù)雜疾病。

BRAKER1使科學(xué)家能夠有效地利用新生物的基因組，加快注釋基因組和獲取生命科學(xué)基本知識的過程。

鄭重聲明：本文版權(quán)歸原作者所有，轉(zhuǎn)載文章僅為傳播更多信息之目的，如有侵權(quán)行為，請第一時(shí)間聯(lián)系我們修改或刪除，多謝。

推薦內(nèi)容