保護(hù)基因組研究中的機(jī)密性
全基因組關(guān)聯(lián)研究尋找特定遺傳變異與疾病發(fā)病率之間的聯(lián)系,是許多現(xiàn)代生物醫(yī)學(xué)研究的基礎(chǔ)。但基因組信息數(shù)據(jù)庫(kù)會(huì)帶來(lái)隱私風(fēng)險(xiǎn)。從人們的原始基因組數(shù)據(jù)中,可以推斷出他們的姓氏,甚至可能是他們臉上的形狀。許多人不愿意將他們的基因組數(shù)據(jù)貢獻(xiàn)給生物醫(yī)學(xué)研究項(xiàng)目,并且在決定是否授予研究人員訪問(wèn)請(qǐng)求之前,托管大型基因組數(shù)據(jù)庫(kù)的組織可能會(huì)進(jìn)行長(zhǎng)達(dá)數(shù)月的審查。
在今天出現(xiàn)在Nature Biotechnology上的一篇論文中,來(lái)自麻省理工學(xué)院和斯坦福大學(xué)的研究人員提出了一個(gè)新的系統(tǒng),用于保護(hù)那些將基因組數(shù)據(jù)貢獻(xiàn)給大規(guī)模生物醫(yī)學(xué)研究的人的隱私。早期的加密方法計(jì)算密集程度太高,以至于超過(guò)幾千個(gè)基因組變得非常耗時(shí),新系統(tǒng)承諾為多達(dá)一百萬(wàn)個(gè)基因組進(jìn)行的研究提供有效的隱私保護(hù)。
“作為生物醫(yī)學(xué)研究人員,我們對(duì)缺乏數(shù)據(jù)和訪問(wèn)控制的存儲(chǔ)庫(kù)感到沮喪,”麻省理工學(xué)院西蒙斯數(shù)學(xué)教授和該論文的相應(yīng)作者Bonnie Berger說(shuō)。“我們期待一個(gè)擁有大量分布式基因組數(shù)據(jù)的未來(lái),私人擁有自己的個(gè)人基因組,研究所和醫(yī)院都建立自己的私人基因組數(shù)據(jù)庫(kù)。我們的工作提供了一個(gè)匯集大量數(shù)據(jù)的路線圖?;蚪M數(shù)據(jù),以促進(jìn)科學(xué)進(jìn)步。“
論文的第一作者是麻省理工學(xué)院電子工程和計(jì)算機(jī)科學(xué)研究生Hyunghoon Cho;他和伯杰加入了斯坦福大學(xué)計(jì)算機(jī)科學(xué)研究生David Wu。
系統(tǒng)的核心是一種稱為秘密共享的技術(shù),它在多個(gè)服務(wù)器之間劃分敏感數(shù)據(jù)。例如,為了存儲(chǔ)數(shù)字x,秘密共享系統(tǒng)可以將隨機(jī)數(shù)r發(fā)送到一個(gè)服務(wù)器而將xr發(fā)送到另一個(gè)服務(wù)器。
兩個(gè)服務(wù)器都不能獨(dú)立地推斷x。但總的來(lái)說(shuō),他們?nèi)匀豢梢詧?zhí)行有用的操作。如果一個(gè)服務(wù)器存儲(chǔ)了一堆r并將它們加在一起,而另一個(gè)服務(wù)器將所有相應(yīng)的(xr)加起來(lái),那么共享結(jié)果并將它們加在一起將產(chǎn)生所有x的總和。但是,兩個(gè)服務(wù)器都不會(huì)觀察到任何一個(gè)x的值。
當(dāng)然,如果兩個(gè)服務(wù)器都被黑客攻擊,攻擊者可以重建所有的x。但只要一臺(tái)服務(wù)器值得信賴,系統(tǒng)就是安全的。此外,該原則推廣到多個(gè)服務(wù)器。如果數(shù)據(jù)在四個(gè)服務(wù)器之間分配,則攻擊者必須滲透所有四個(gè)服務(wù)器;黑客攻擊任何三個(gè)都不足以提取任何數(shù)據(jù)。
然而,在這種情況下,乘法比加法更復(fù)雜。乘以兩個(gè)x需要生成三個(gè)隨機(jī)數(shù)- 在密碼學(xué)家唐納德比弗之后,除了r之外,被稱為Beaver三元組。反過(guò)來(lái),這三個(gè)數(shù)字必須在使用秘密共享的服務(wù)器之間進(jìn)行劃分。在乘法之前將這些數(shù)字的秘密共享分量添加到x和r中會(huì)產(chǎn)生代數(shù)表達(dá)式,其中可以濾除所有添加的隨機(jī)性,僅留下兩個(gè)x的乘積。
全基因組關(guān)聯(lián)研究涉及一個(gè)龐大的表格或矩陣,它將數(shù)據(jù)庫(kù)中的基因組與單核苷酸多態(tài)性的SNP遺傳變異位置進(jìn)行對(duì)比。SNP通常約為一百萬(wàn),因此如果數(shù)據(jù)庫(kù)包含一百萬(wàn)個(gè)基因組,結(jié)果將是一百萬(wàn)個(gè)百萬(wàn)的矩陣。
尋找有用的疾病相關(guān)性需要過(guò)濾誤導(dǎo)性相關(guān)性,這一過(guò)程稱為人口分層校正。例如,東亞人經(jīng)常乳糖不耐癥,但他們也往往比北歐人短。對(duì)乳糖不耐受的遺傳相關(guān)性進(jìn)行的初步調(diào)查可能最終會(huì)確定那些高度不足的人。
群體分層校正通常依賴于稱為主成分分析的算法,其需要涉及整個(gè)SNP對(duì)基因組矩陣的重復(fù)乘法。如果矩陣中的每個(gè)條目都需要為這些乘法中的每一個(gè)都使用其自己的一組Beaver三元組,那么分析一百萬(wàn)個(gè)基因組將非常耗時(shí)。
但Cho,Berger和Wu找到了一種構(gòu)造乘法序列的方法,這樣許多Beaver三元組只能計(jì)算一次并重復(fù)使用,從而大大降低了計(jì)算的復(fù)雜性。
他們還使用其他幾種技術(shù)來(lái)加速他們的系統(tǒng)。由于Beaver三元組必須秘密共享,因此Beaver三元組中的每個(gè)數(shù)字都有一個(gè)相關(guān)的隨機(jī)數(shù):在雙服務(wù)器方案中,一個(gè)服務(wù)器將獲得隨機(jī)數(shù),另一個(gè)服務(wù)器將獲得Beaver數(shù)減去隨機(jī)數(shù)。
在Cho,Berger和Wu的系統(tǒng)中,有一個(gè)服務(wù)器致力于生成Beaver三元組并秘密共享它們。但是,雖然需要將海貍數(shù)量減去相關(guān)的隨機(jī)數(shù)傳輸?shù)竭m當(dāng)?shù)姆?wù)器,但它不需要自己傳輸隨機(jī)數(shù)。相反,它只是共享用于“種子”稱為偽隨機(jī)數(shù)生成器的算法的數(shù)字。然后,接收方服務(wù)器可以自己生成隨機(jī)數(shù),從而節(jié)省了大量的通信帶寬。
最后,當(dāng)執(zhí)行所有乘法運(yùn)算時(shí),系統(tǒng)實(shí)際上并沒(méi)有使用整個(gè)百萬(wàn)分之一的矩陣。相反,它使用稱為隨機(jī)投影的近似技術(shù)來(lái)降低矩陣,同時(shí)保持最終計(jì)算結(jié)果的準(zhǔn)確性。
基于這些技術(shù),Cho,Berger和Wu的系統(tǒng)準(zhǔn)確地再現(xiàn)了三個(gè)??已發(fā)表的涉及23,000個(gè)個(gè)體基因組的全基因組關(guān)聯(lián)研究。這些分析的結(jié)果表明該系統(tǒng)應(yīng)該有效地?cái)U(kuò)展到一百萬(wàn)個(gè)基因組。
推薦內(nèi)容
-
一種有前途的新工具來(lái)測(cè)量抗瘧疾的抗體
可以使用需要非常少量血液的簡(jiǎn)單,準(zhǔn)確和可重復(fù)的測(cè)定來(lái)測(cè)量針對(duì)多種惡性瘧原蟲(chóng)蛋白(或抗原)的抗體。在最近發(fā)表的一系列文章中,由ISGlobal
-
12月4日河北石家莊鹿泉區(qū)工地疫情消息公布 今日通報(bào):4名確診
河北石家莊鹿泉區(qū)4名確診人員均為外來(lái)務(wù)工人員。據(jù)消息顯示,12月4日,石家莊市人民政府召開(kāi)疫情防控新聞發(fā)布會(huì),石家莊副市長(zhǎng)張峰珍介紹,
-
CRISPR篩選識(shí)別幫助細(xì)胞抵抗西尼羅河寨卡病毒的基因
UT西南大學(xué)的研究人員今天報(bào)告首次使用CRISPR全基因組篩選鑒定一種有助于細(xì)胞抵抗黃病毒感染的基因。令人討厭的一類病原體包括西尼羅河病毒
-
魚(yú)的早期生活如何幫助決定其未來(lái)
一項(xiàng)新的研究表明,了解魚(yú)類在成熟過(guò)程中的活動(dòng)可以幫助科學(xué)家識(shí)別和管理魚(yú)類在早期生活中依賴的脆弱棲息地。研究人員檢查了紅海鯛魚(yú)的...
-
獼猴測(cè)試抗HBV藥物和疫苗的新動(dòng)物模型
每年有數(shù)百萬(wàn)人感染乙型肝炎病毒,結(jié)果導(dǎo)致50萬(wàn)人死亡??梢鸶伟┑牟《?HBV)繼續(xù)無(wú)視疫苗并抵抗目前的抗HBV治療1,2。缺乏HBV感染的動(dòng)物模
-
遺傳學(xué)研究揭示了真菌性秘密揭示了念珠菌病
根據(jù)西班牙巴塞羅那基因組監(jiān)管中心研究人員發(fā)表在Current Biology上的一項(xiàng)新研究,來(lái)自世界各地的真菌酵母菌感染(念珠菌病)的新遺傳分析揭
-
通過(guò)恢復(fù)p53腫瘤抑制基因的表達(dá)可以逆轉(zhuǎn)惡變前和惡性病變
恢復(fù)p53蛋白在癌前增生和惡性的p53缺陷型松果體病變,一個(gè)罕見(jiàn)的腦腫瘤的,可逆轉(zhuǎn)的惡性狀態(tài),根據(jù)一項(xiàng)新的研究。基因p53通過(guò)幾種機(jī)制起到
-
針對(duì)罕見(jiàn)疾病的新療法對(duì)孤立的土著社區(qū)造成嚴(yán)重破壞
麥考瑞大學(xué)的研究人員開(kāi)發(fā)出了神經(jīng)退行性馬查多 - 約瑟夫病的第一個(gè)斑馬魚(yú)模型 - 并且已經(jīng)使用這個(gè)模型來(lái)測(cè)試可能用于治療疾病的藥物,
-
利用簡(jiǎn)單的聚合物工具的力量來(lái)檢測(cè)土壤中的有毒化學(xué)物質(zhì)
監(jiān)測(cè)沉積物和土壤中有毒化學(xué)物質(zhì)含量的大多數(shù)現(xiàn)有技術(shù)僅提供樣本采集時(shí)污染物的快照,而無(wú)法追蹤其長(zhǎng)期影響?,F(xiàn)在,一個(gè)國(guó)際研究團(tuán)隊(duì)在...
-
基因組測(cè)序顯示數(shù)千年前適應(yīng)高原的玉米
一個(gè)國(guó)際研究團(tuán)隊(duì)已經(jīng)發(fā)現(xiàn)證據(jù)顯示,幾千年前玉米進(jìn)化為在美國(guó)西南高地生存。在他們發(fā)表在科學(xué)雜志上的論文中,該小組概述了他們的基因...