综合精品天天夜夜久久,日本中文字幕二区区精品,亚洲欧美中文字幕制服二区,青青青国产爽爽视频免费观看

        中國(guó)基因網(wǎng)您的位置:首頁(yè) >行業(yè)動(dòng)態(tài) >

        合成生物學(xué)家開(kāi)發(fā)蛋白質(zhì)語(yǔ)言的耳朵

        就像字符串可以賦予含義一樣,氨基酸序列可以賦予確定的三維結(jié)構(gòu)以及所需的化學(xué)和生物學(xué)特性。這里的關(guān)鍵詞是“可能”。在合成蛋白質(zhì)中,氨基酸序列可能最終變得有意義或產(chǎn)生亂碼。如何事先知道序列的“含義”?這個(gè)問(wèn)題長(zhǎng)期困擾著蛋白質(zhì)工程師,他們尋求雄辯的,錯(cuò)誤的,優(yōu)雅的解決方案來(lái)解決生物制造問(wèn)題。幸運(yùn)的是,可能會(huì)有一個(gè)答案。這稱為統(tǒng)一表示或UniRep(一種機(jī)器學(xué)習(xí)方法)。

        合成生物學(xué)家開(kāi)發(fā)蛋白質(zhì)語(yǔ)言的耳朵

        UniRep來(lái)自哈佛大學(xué)的Wyss生物啟發(fā)工程研究所,由喬治·丘奇(George Church)博士領(lǐng)導(dǎo)的研究小組利用一種人工智能的深度學(xué)習(xí)技術(shù),直接從蛋白質(zhì)的氨基酸序列中提取蛋白質(zhì)的基本特征。根據(jù)丘奇和他的同事所說(shuō),這種方法不需要額外的信息,并且可以將許多費(fèi)力的實(shí)驗(yàn)室實(shí)驗(yàn)轉(zhuǎn)移到計(jì)算機(jī)上。

        研究人員的深度學(xué)習(xí)方法于10月21日在《自然方法》上發(fā)表,文章標(biāo)題為“ 基于序列的深度表示學(xué)習(xí)的統(tǒng)一理性蛋白質(zhì)工程 ”。該文章指出,UniRep允許構(gòu)建廣泛適用和概括的統(tǒng)計(jì)模型。到序列空間中看不見(jiàn)的區(qū)域。此外,該文章還堅(jiān)持認(rèn)為統(tǒng)計(jì)模型“在語(yǔ)義上是豐富的,并且在結(jié)構(gòu),進(jìn)化和生物上都有扎實(shí)的基礎(chǔ)”。

        文章的作者寫(xiě)道:“我們的數(shù)據(jù)驅(qū)動(dòng)方法可以預(yù)測(cè)天然和從頭設(shè)計(jì)的蛋白質(zhì)的穩(wěn)定性,以及分子多樣性突變體的定量功能,這與最新方法具有競(jìng)爭(zhēng)性。” “ UniRep進(jìn)一步使蛋白質(zhì)工程任務(wù)的效率提高了兩個(gè)數(shù)量級(jí)。”

        蛋白質(zhì)工程的更多常規(guī)方法包括定向進(jìn)化和合理設(shè)計(jì)。在定向進(jìn)化中,蛋白質(zhì)工程師隨機(jī)改變編碼天然蛋白質(zhì)的氨基酸構(gòu)件的線性序列,并篩選具有所需活性的變體。在合理的設(shè)計(jì)中,蛋白質(zhì)工程師根據(jù)蛋白質(zhì)的實(shí)際3D結(jié)構(gòu)對(duì)蛋白質(zhì)建模,以識(shí)別可能會(huì)影響蛋白質(zhì)功能的氨基酸。

        定向進(jìn)化只能覆蓋可能的蛋白質(zhì)序列巨大空間的一小部分。精心設(shè)計(jì)的3D蛋白質(zhì)結(jié)構(gòu)的相對(duì)稀缺性限制了合理的設(shè)計(jì)方法。但是,UniRep承諾對(duì)蛋白質(zhì)功能有更全面的了解。

        “無(wú)需廣泛表征蛋白質(zhì)來(lái)理解其設(shè)計(jì)原理,我們通過(guò)在公共數(shù)據(jù)庫(kù)中系統(tǒng)地尋找大量原始蛋白質(zhì)序列中的模式,而是使用神經(jīng)網(wǎng)絡(luò)以無(wú)偏見(jiàn)的方式學(xué)習(xí)那些規(guī)則,”研究生Surojit Biswas說(shuō)是Church小組的學(xué)生,也是《自然方法》論文的三位共同第一作者之一。“神經(jīng)網(wǎng)絡(luò)通過(guò)許多艱苦的研究,學(xué)到了許多人類(lèi)以前知道的規(guī)則,除此之外,它還發(fā)現(xiàn)了蛋白質(zhì)的新功能。”

        可以將神經(jīng)網(wǎng)絡(luò)方法比喻為學(xué)習(xí)一種語(yǔ)言,在這種語(yǔ)言中,學(xué)習(xí)者可以建立語(yǔ)義理解,了解如何從字母和單詞的字符串構(gòu)造復(fù)雜的句子。在蛋白質(zhì)語(yǔ)言中,UniRep經(jīng)過(guò)培訓(xùn),可以探索公共數(shù)據(jù)庫(kù)中包含的蛋白質(zhì)序列中的所有可能性,從而從其第一個(gè)氨基酸開(kāi)始預(yù)測(cè)蛋白質(zhì)序列中的下一個(gè)氨基酸。

        在重復(fù)處理蛋白質(zhì)的其余部分(一次一個(gè)氨基酸)的過(guò)程中,UniRep制作并利用了迄今為止在蛋白質(zhì)中看到的序列的內(nèi)部“摘要”,該小組稱其為“隱藏狀態(tài)”,考慮到其個(gè)體順序和結(jié)構(gòu)特征。將這些信息以及來(lái)自許多其他蛋白質(zhì)的結(jié)果反饋回其算法,UniRep逐漸修改了其構(gòu)造隱藏狀態(tài)的方式,從而隨著時(shí)間的推移提高了其預(yù)測(cè)能力。

        在語(yǔ)言類(lèi)比中,基于對(duì)語(yǔ)法和單詞選擇的不斷改進(jìn),學(xué)習(xí)者將能夠以更高的可能性預(yù)測(cè)他們正在閱讀的句子的下一個(gè)單詞。

        “我們?cè)诖蠹s三周的時(shí)間內(nèi)對(duì)UniRep進(jìn)行了約2400萬(wàn)個(gè)蛋白質(zhì)序列的培訓(xùn),以使其能夠預(yù)測(cè)序列及其與諸如蛋白質(zhì)穩(wěn)定性,二級(jí)結(jié)構(gòu)以及內(nèi)部序列對(duì)蛋白質(zhì)內(nèi)周?chē)軇┑目杉靶灾?lèi)的特性之間的聯(lián)系,” Grigory Khimulya是哈佛大學(xué)的學(xué)生,也是Biswas和Ethan C. Alley的共同第一作者。“ UniRep準(zhǔn)確地描述了來(lái)自非常不同的蛋白質(zhì)家族的蛋白質(zhì)的這些特征,這些蛋白質(zhì)的結(jié)構(gòu)在先前的研究中得到了很好的表征,甚至在本質(zhì)上沒(méi)有對(duì)應(yīng)物的合成蛋白質(zhì)中也是如此。”

        該團(tuán)隊(duì)將UniRep更進(jìn)一步,并將其用作預(yù)測(cè)單個(gè)氨基酸取代如何影響蛋白質(zhì)功能的工具。想想瘋子,但對(duì)于蛋白質(zhì)。

        該神經(jīng)網(wǎng)絡(luò)以多種生物學(xué)功能(包括酶催化,DNA結(jié)合,分子傳感)可靠地量化了8種不同蛋白質(zhì)中單個(gè)氨基酸突變的影響。此外,他們使用維多利亞水母綠色熒光蛋白(GFP)作為模型,委托UniRep分析該蛋白的64,800個(gè)變異體,每個(gè)變異體帶有1–12個(gè)突變,這表明它可以準(zhǔn)確預(yù)測(cè)突變的分布和相對(duì)負(fù)擔(dān)改變了蛋白質(zhì)的亮度。

        丘奇說(shuō):“與其他策略相比,我們的數(shù)據(jù)驅(qū)動(dòng)方法在預(yù)測(cè)蛋白質(zhì)的多種特性方面達(dá)到了最新或更高的性能,而成本卻遠(yuǎn)低于其他方法。” “這使它成為許多領(lǐng)域蛋白質(zhì)工程師的真正授權(quán)工具。”

        鄭重聲明:本文版權(quán)歸原作者所有,轉(zhuǎn)載文章僅為傳播更多信息之目的,如有侵權(quán)行為,請(qǐng)第一時(shí)間聯(lián)系我們修改或刪除,多謝。

        推薦內(nèi)容