建立模型以比以往更準確地重建進化變化
還記得我們在中學生物學中學到的領域,王國,門,階級,秩序,家庭,屬,物種和達爾文的生命樹隱喻嗎?這種描述生命事物譜系的方式,是科學界對基因如何隨著時間發(fā)生突變和分裂以將事物改變?yōu)槿缃竦臓顟B(tài)所做的最好猜測。
隨著科學越來越擅長識別蛋白質和基因的變化,將生物重新分類為另一個屬并不少見。例如,最近,各種細菌,植物和珊瑚的分類法發(fā)生了變化。
如果您可以建立一個更好的進化變化模型,盡管它可能不是100%準確(考慮到復雜的生物體已經(jīng)進化了數(shù)十億年),卻能為您提供比以往更清晰的圖景?
克里斯汀·納格勒(Kristen Naegle)是弗吉尼亞大學工程學院的生物醫(yī)學工程和計算機科學副教授,也是UVA公共衛(wèi)生基因組學中心的常任理事,并曾擔任博士學位。當時的學生羅曼·斯洛特斯基(Roman Sloutsky)現(xiàn)在是麻省大學阿默斯特分校的博士后研究員。他們的工作展示了如何構建模型來比以往任何時候都更準確地重建進化變化,這為了解疾病在人體中的工作方式帶來了突破。
他們的論文“ ASPEN,一種使用整體模型重建蛋白質進化的方法,”在10月17日星期四發(fā)表在eLife雜志上。ASPEN代表“通過蛋白質進化子采樣的準確性”。他們的研究突出了UVA在生物醫(yī)學數(shù)據(jù)科學中的優(yōu)勢。
當今使用的大多數(shù)蛋白質進化模型可能是錯誤的?,F(xiàn)在,我們有一種方法可以探究這些模型,并詢問如何使用正確的模型來構建更好的模型。這是重要的一步。
為了更好地理解他們在建模演化變化方面工作的復雜性,Naegle提供了一個類比:“如果我要求您預測某人在舊金山和紐約之間走的路線,那將是一個模型。但是如果我要求1,000個人給我一個人走哪條路線的預測,那么這條路線在1000人中共享最多的部分就很可能是真實的,這是因為大多數(shù)人可能都認為,兩個城市之間的特定高速公路是最有效的要走的路,這樣高速公路的那部分就會有很大的分量或概率。
“如果我發(fā)現(xiàn)在這1000條路線中沒有人達成任何協(xié)議,那將告訴我,我對任何一種模型的準確性都沒有信心。相反,如果每個人都對路線的絕大部分或大部分達成共識,我非常有信心在這兩個點之間必須有一種最佳的旅行方式,我可以想出一條新路線,而不是這1000個人中的任何一條,而是捕捉所有這1000個人之間共享最多的路線建議,該模型可能比提供給我的任何單個模型都更接近真實路線。最后,它可能仍然不完全準確-我永遠無法知道真實路線,除非我詢問實際執(zhí)行此操作的人旅行-但這可能比單獨的任何一條路線建議要好得多。
進化就是這樣,只是就像在猜測通過時間而不是空間的路線。”
重建進化分支是棘手的,特別是當許多物種共享相似類型的蛋白質時,這種蛋白質可能已經(jīng)進化為執(zhí)行某些不同的功能。從數(shù)學上講,問題很快就變得非常嚴重,但是發(fā)現(xiàn)這種蛋白質進化的含義可能會導致人們更好地了解我們的身體如何應對癌癥和其他疾病。
這個問題的解決方法是Sloutsky在研究許多不同物種共有的細胞信號傳導中的重要蛋白質時提出的。他想知道這種蛋白質是如何隨著時間演變而在不同物種中具有不同功能的。這個問題是如此之大,他決定只對幾個序列進行抽樣,以重建進化的分歧。
他說,盡管進行了1000次嘗試,但重建工作彼此不同。“這本身并不是一個大問題-我沒想到他們都會同意。但是我希望一個模型在大多數(shù)時間或至少很多時間可以重復。”
驚訝的是,他決定看看所有不同意見的模型有什么共同點。他說:“我知道我將不得不想出一種方法來合并所有這些模型中的信息,因為我不能只使用最常見的模型。” “這是一個意外的挑戰(zhàn),導致了這項工作。”
在幾個月的時間里,Naegle和Sloutsky改進了軟件并測試了越來越多的針對蛋白質的重構問題,Naegle和Sloutsky能夠創(chuàng)建開源軟件,該軟件可以結合多個模型來非常準確地重構進化變化。
斯勞茨基說:“我們身體所做的一切都是由蛋白質完成的。” “這是了解分子生物學如何工作,蛋白質如何工作以及何時出錯,出錯的強大工具。”
Naegle和Sloutsky的原始數(shù)據(jù)和代碼包含在eLife出版物中,因此其他研究人員可以將其用于更精確的建模。
專注于生命和生物醫(yī)學的eLife雜志在科學雜志中是獨一無二的。同行審稿人評估文章的研究和質量,審稿人的問題和作者的答案也包含在出版物中。該雜志的哲學是知識應該是開放的和可訪問的。
例如,研究人員將能夠使用Naegle和Sloutsky的新工具來了解相似蛋白質的進化程度,然后設計更好的藥物以更特異性地靶向蛋白質。內格勒還想象著一個醫(yī)生試圖利用醫(yī)學成像來識別隱藏在患者體內深處的腫塊的確切位置和形狀。這種更精確的建模工具可以幫助醫(yī)生更好地了解腫塊,而無需將患者割開。
內格勒說:“喬治·埃弗·博克斯(George EP Box)關于模型的引用哲學在這里很重要:'本質上,所有模型都是錯誤的,但有些模型是有用的。” “我們現(xiàn)在有了一種量化的方法來詢問一個模型有多好,通過在許多模型中使用最有用的部分,我們可以構建更好的模型。
推薦內容
-
研究塑造人類行為的基因 但這也可能引發(fā)自閉癥
被稱為人類加速區(qū)域(HARs)的人類基因組的特定區(qū)域包含形成復雜的社會和認知行為的基因,在進化過程中將人類與黑猩猩(他們最親近的親屬)區(qū)分
-
與脂質水平相關的基因分數(shù)
一個國際科學家小組已經(jīng)確定了人類DNA的157種改變,它們可以影響血液中的脂質,如膽固醇,并在Nature Genetics中公布了它們的結果。該研究
-
研究人員正在利用機器學習來了解微生物關系
亞馬遜河及其周圍的生態(tài)系統(tǒng)是世界上生物多樣性最豐富的。但考慮到大約30英尺的人體胃腸(GI)道,它有一些競爭。這種微生物組 - 特定環(huán)境
-
團隊揭示了生態(tài)系統(tǒng)中攜帶基因mcr-1的細菌的高流行率
最近的一項研究合作發(fā)現(xiàn)攜帶粘菌素抗性基因mcr-1的細菌通常存在于從香港和中國大陸收集的食品和環(huán)境樣品中。mcr-1基因是2015年中國科學家發(fā)
-
研究可能有助于科學家更多地了解慢性疼痛的原因
北卡羅萊納州立大學的研究人員發(fā)現(xiàn),炎癥會增加與小鼠的熱感覺有關的神經(jīng)元的神經(jīng)元活性,基因表達和感覺神經(jīng)(神經(jīng)突)的生長,但對小鼠...
-
10月19日四川全省疫情最新數(shù)據(jù)公布 四川昨日新增境外輸入無癥
提醒:戴口罩。上下班 工作中要佩戴口罩,如果有發(fā)熱咳嗽等癥狀時就醫(yī)時、擁擠時、乘電梯時、乘坐公共交通工具時、進入人員密集等公共場所
-
腸道微生物群的健康和平衡在細菌感染的進展中是重要的
根據(jù)一項新的研究,腸道微生物群的健康和平衡在細菌感染的進展中很重要。由格拉斯哥大學領導并在Nature Communications上發(fā)表的一項新研究
-
哪些基因對古細菌的能量代謝至關重要
由維也納大學的Christa Schleper領導的一個研究小組成功地從土壤中分離出了第一個氨氧化古菌:Nitrososphaera viennensis--來自維也納的
-
遺傳學家對緬甸蟒蛇眼鏡王蛇的基因組進行測序
一個國際研究團隊對眼鏡王蛇(Ophiophagus hannah)的基因組進行了測序和分析。研究小組還對緬甸蟒蛇(Python molurus bivittatus)的基因組
-
10月21日昆明張掖疫情最新數(shù)據(jù)公布 甘肅新增6例本土確診病例詳
20日20時至21日12時,甘肅省新增6例本土確診病例。據(jù)消息顯示,10月20日20時-21日12時,甘肅省新增6例本土新冠肺炎確診病例。自2020年1月23