综合精品天天夜夜久久,日本中文字幕二区区精品,亚洲欧美中文字幕制服二区,青青青国产爽爽视频免费观看

<delect id="tyqyr"></delect>

<u id="tyqyr"></u>

中國(guó)基因網(wǎng)您的位置：首頁(yè) >行業(yè)動(dòng)態(tài) >

合成生物學(xué)家開(kāi)發(fā)蛋白質(zhì)語(yǔ)言的耳朵

2019-11-13 09:59:50 ? 來(lái)源：

就像字符串可以賦予含義一樣，氨基酸序列可以賦予確定的三維結(jié)構(gòu)以及所需的化學(xué)和生物學(xué)特性。這里的關(guān)鍵詞是“可能”。在合成蛋白質(zhì)中，氨基酸序列可能最終變得有意義或產(chǎn)生亂碼。如何事先知道序列的“含義”?這個(gè)問(wèn)題長(zhǎng)期困擾著蛋白質(zhì)工程師，他們尋求雄辯的，錯(cuò)誤的，優(yōu)雅的解決方案來(lái)解決生物制造問(wèn)題。幸運(yùn)的是，可能會(huì)有一個(gè)答案。這稱為統(tǒng)一表示或UniRep(一種機(jī)器學(xué)習(xí)方法)。

UniRep來(lái)自哈佛大學(xué)的Wyss生物啟發(fā)工程研究所，由喬治·丘奇(George Church)博士領(lǐng)導(dǎo)的研究小組利用一種人工智能的深度學(xué)習(xí)技術(shù)，直接從蛋白質(zhì)的氨基酸序列中提取蛋白質(zhì)的基本特征。根據(jù)丘奇和他的同事所說(shuō)，這種方法不需要額外的信息，并且可以將許多費(fèi)力的實(shí)驗(yàn)室實(shí)驗(yàn)轉(zhuǎn)移到計(jì)算機(jī)上。

研究人員的深度學(xué)習(xí)方法于10月21日在《自然方法》上發(fā)表，文章標(biāo)題為“ 基于序列的深度表示學(xué)習(xí)的統(tǒng)一理性蛋白質(zhì)工程 ”。該文章指出，UniRep允許構(gòu)建廣泛適用和概括的統(tǒng)計(jì)模型。到序列空間中看不見(jiàn)的區(qū)域。此外，該文章還堅(jiān)持認(rèn)為統(tǒng)計(jì)模型“在語(yǔ)義上是豐富的，并且在結(jié)構(gòu)，進(jìn)化和生物上都有扎實(shí)的基礎(chǔ)”。

文章的作者寫(xiě)道：“我們的數(shù)據(jù)驅(qū)動(dòng)方法可以預(yù)測(cè)天然和從頭設(shè)計(jì)的蛋白質(zhì)的穩(wěn)定性，以及分子多樣性突變體的定量功能，這與最新方法具有競(jìng)爭(zhēng)性。” “ UniRep進(jìn)一步使蛋白質(zhì)工程任務(wù)的效率提高了兩個(gè)數(shù)量級(jí)。”

蛋白質(zhì)工程的更多常規(guī)方法包括定向進(jìn)化和合理設(shè)計(jì)。在定向進(jìn)化中，蛋白質(zhì)工程師隨機(jī)改變編碼天然蛋白質(zhì)的氨基酸構(gòu)件的線性序列，并篩選具有所需活性的變體。在合理的設(shè)計(jì)中，蛋白質(zhì)工程師根據(jù)蛋白質(zhì)的實(shí)際3D結(jié)構(gòu)對(duì)蛋白質(zhì)建模，以識(shí)別可能會(huì)影響蛋白質(zhì)功能的氨基酸。

定向進(jìn)化只能覆蓋可能的蛋白質(zhì)序列巨大空間的一小部分。精心設(shè)計(jì)的3D蛋白質(zhì)結(jié)構(gòu)的相對(duì)稀缺性限制了合理的設(shè)計(jì)方法。但是，UniRep承諾對(duì)蛋白質(zhì)功能有更全面的了解。

“無(wú)需廣泛表征蛋白質(zhì)來(lái)理解其設(shè)計(jì)原理，我們通過(guò)在公共數(shù)據(jù)庫(kù)中系統(tǒng)地尋找大量原始蛋白質(zhì)序列中的模式，而是使用神經(jīng)網(wǎng)絡(luò)以無(wú)偏見(jiàn)的方式學(xué)習(xí)那些規(guī)則，”研究生Surojit Biswas說(shuō)是Church小組的學(xué)生，也是《自然方法》論文的三位共同第一作者之一。“神經(jīng)網(wǎng)絡(luò)通過(guò)許多艱苦的研究，學(xué)到了許多人類(lèi)以前知道的規(guī)則，除此之外，它還發(fā)現(xiàn)了蛋白質(zhì)的新功能。”

可以將神經(jīng)網(wǎng)絡(luò)方法比喻為學(xué)習(xí)一種語(yǔ)言，在這種語(yǔ)言中，學(xué)習(xí)者可以建立語(yǔ)義理解，了解如何從字母和單詞的字符串構(gòu)造復(fù)雜的句子。在蛋白質(zhì)語(yǔ)言中，UniRep經(jīng)過(guò)培訓(xùn)，可以探索公共數(shù)據(jù)庫(kù)中包含的蛋白質(zhì)序列中的所有可能性，從而從其第一個(gè)氨基酸開(kāi)始預(yù)測(cè)蛋白質(zhì)序列中的下一個(gè)氨基酸。

在重復(fù)處理蛋白質(zhì)的其余部分(一次一個(gè)氨基酸)的過(guò)程中，UniRep制作并利用了迄今為止在蛋白質(zhì)中看到的序列的內(nèi)部“摘要”，該小組稱其為“隱藏狀態(tài)”，考慮到其個(gè)體順序和結(jié)構(gòu)特征。將這些信息以及來(lái)自許多其他蛋白質(zhì)的結(jié)果反饋回其算法，UniRep逐漸修改了其構(gòu)造隱藏狀態(tài)的方式，從而隨著時(shí)間的推移提高了其預(yù)測(cè)能力。

在語(yǔ)言類(lèi)比中，基于對(duì)語(yǔ)法和單詞選擇的不斷改進(jìn)，學(xué)習(xí)者將能夠以更高的可能性預(yù)測(cè)他們正在閱讀的句子的下一個(gè)單詞。

“我們?cè)诖蠹s三周的時(shí)間內(nèi)對(duì)UniRep進(jìn)行了約2400萬(wàn)個(gè)蛋白質(zhì)序列的培訓(xùn)，以使其能夠預(yù)測(cè)序列及其與諸如蛋白質(zhì)穩(wěn)定性，二級(jí)結(jié)構(gòu)以及內(nèi)部序列對(duì)蛋白質(zhì)內(nèi)周?chē)軇┑目杉靶灾?lèi)的特性之間的聯(lián)系，” Grigory Khimulya是哈佛大學(xué)的學(xué)生，也是Biswas和Ethan C. Alley的共同第一作者。“ UniRep準(zhǔn)確地描述了來(lái)自非常不同的蛋白質(zhì)家族的蛋白質(zhì)的這些特征，這些蛋白質(zhì)的結(jié)構(gòu)在先前的研究中得到了很好的表征，甚至在本質(zhì)上沒(méi)有對(duì)應(yīng)物的合成蛋白質(zhì)中也是如此。”

該團(tuán)隊(duì)將UniRep更進(jìn)一步，并將其用作預(yù)測(cè)單個(gè)氨基酸取代如何影響蛋白質(zhì)功能的工具。想想瘋子，但對(duì)于蛋白質(zhì)。

該神經(jīng)網(wǎng)絡(luò)以多種生物學(xué)功能(包括酶催化，DNA結(jié)合，分子傳感)可靠地量化了8種不同蛋白質(zhì)中單個(gè)氨基酸突變的影響。此外，他們使用維多利亞水母綠色熒光蛋白(GFP)作為模型，委托UniRep分析該蛋白的64,800個(gè)變異體，每個(gè)變異體帶有1–12個(gè)突變，這表明它可以準(zhǔn)確預(yù)測(cè)突變的分布和相對(duì)負(fù)擔(dān)改變了蛋白質(zhì)的亮度。

丘奇說(shuō)：“與其他策略相比，我們的數(shù)據(jù)驅(qū)動(dòng)方法在預(yù)測(cè)蛋白質(zhì)的多種特性方面達(dá)到了最新或更高的性能，而成本卻遠(yuǎn)低于其他方法。” “這使它成為許多領(lǐng)域蛋白質(zhì)工程師的真正授權(quán)工具。”

鄭重聲明：本文版權(quán)歸原作者所有，轉(zhuǎn)載文章僅為傳播更多信息之目的，如有侵權(quán)行為，請(qǐng)第一時(shí)間聯(lián)系我們修改或刪除，多謝。

推薦內(nèi)容

<button id="dbhw8"><wbr id="dbhw8"></wbr></button>