综合精品天天夜夜久久,日本中文字幕二区区精品,亚洲欧美中文字幕制服二区,青青青国产爽爽视频免费观看

        中國(guó)基因網(wǎng)您的位置:首頁(yè) >基因檢測(cè) >

        保護(hù)基因組研究中的機(jī)密性

        全基因組關(guān)聯(lián)研究尋找特定遺傳變異與疾病發(fā)病率之間的聯(lián)系,是許多現(xiàn)代生物醫(yī)學(xué)研究的基礎(chǔ)。但基因組信息數(shù)據(jù)庫(kù)會(huì)帶來(lái)隱私風(fēng)險(xiǎn)。從人們的原始基因組數(shù)據(jù)中,可以推斷出他們的姓氏,甚至可能是他們臉上的形狀。許多人不愿意將他們的基因組數(shù)據(jù)貢獻(xiàn)給生物醫(yī)學(xué)研究項(xiàng)目,并且在決定是否授予研究人員訪問(wèn)請(qǐng)求之前,托管大型基因組數(shù)據(jù)庫(kù)的組織可能會(huì)進(jìn)行長(zhǎng)達(dá)數(shù)月的審查。

        保護(hù)基因組研究中的機(jī)密性

        在今天出現(xiàn)在Nature Biotechnology上的一篇論文中,來(lái)自麻省理工學(xué)院和斯坦福大學(xué)的研究人員提出了一個(gè)新的系統(tǒng),用于保護(hù)那些將基因組數(shù)據(jù)貢獻(xiàn)給大規(guī)模生物醫(yī)學(xué)研究的人的隱私。早期的加密方法計(jì)算密集程度太高,以至于超過(guò)幾千個(gè)基因組變得非常耗時(shí),新系統(tǒng)承諾為多達(dá)一百萬(wàn)個(gè)基因組進(jìn)行的研究提供有效的隱私保護(hù)。

        “作為生物醫(yī)學(xué)研究人員,我們對(duì)缺乏數(shù)據(jù)和訪問(wèn)控制的存儲(chǔ)庫(kù)感到沮喪,”麻省理工學(xué)院西蒙斯數(shù)學(xué)教授和該論文的相應(yīng)作者Bonnie Berger說(shuō)。“我們期待一個(gè)擁有大量分布式基因組數(shù)據(jù)的未來(lái),私人擁有自己的個(gè)人基因組,研究所和醫(yī)院都建立自己的私人基因組數(shù)據(jù)庫(kù)。我們的工作提供了一個(gè)匯集大量數(shù)據(jù)的路線圖?;蚪M數(shù)據(jù),以促進(jìn)科學(xué)進(jìn)步。“

        論文的第一作者是麻省理工學(xué)院電子工程和計(jì)算機(jī)科學(xué)研究生Hyunghoon Cho;他和伯杰加入了斯坦福大學(xué)計(jì)算機(jī)科學(xué)研究生David Wu。

        系統(tǒng)的核心是一種稱為秘密共享的技術(shù),它在多個(gè)服務(wù)器之間劃分敏感數(shù)據(jù)。例如,為了存儲(chǔ)數(shù)字x,秘密共享系統(tǒng)可以將隨機(jī)數(shù)r發(fā)送到一個(gè)服務(wù)器而將xr發(fā)送到另一個(gè)服務(wù)器。

        兩個(gè)服務(wù)器都不能獨(dú)立地推斷x。但總的來(lái)說(shuō),他們?nèi)匀豢梢詧?zhí)行有用的操作。如果一個(gè)服務(wù)器存儲(chǔ)了一堆r并將它們加在一起,而另一個(gè)服務(wù)器將所有相應(yīng)的(xr)加起來(lái),那么共享結(jié)果并將它們加在一起將產(chǎn)生所有x的總和。但是,兩個(gè)服務(wù)器都不會(huì)觀察到任何一個(gè)x的值。

        當(dāng)然,如果兩個(gè)服務(wù)器都被黑客攻擊,攻擊者可以重建所有的x。但只要一臺(tái)服務(wù)器值得信賴,系統(tǒng)就是安全的。此外,該原則推廣到多個(gè)服務(wù)器。如果數(shù)據(jù)在四個(gè)服務(wù)器之間分配,則攻擊者必須滲透所有四個(gè)服務(wù)器;黑客攻擊任何三個(gè)都不足以提取任何數(shù)據(jù)。

        然而,在這種情況下,乘法比加法更復(fù)雜。乘以兩個(gè)x需要生成三個(gè)隨機(jī)數(shù)- 在密碼學(xué)家唐納德比弗之后,除了r之外,被稱為Beaver三元組。反過(guò)來(lái),這三個(gè)數(shù)字必須在使用秘密共享的服務(wù)器之間進(jìn)行劃分。在乘法之前將這些數(shù)字的秘密共享分量添加到x和r中會(huì)產(chǎn)生代數(shù)表達(dá)式,其中可以濾除所有添加的隨機(jī)性,僅留下兩個(gè)x的乘積。

        全基因組關(guān)聯(lián)研究涉及一個(gè)龐大的表格或矩陣,它將數(shù)據(jù)庫(kù)中的基因組與單核苷酸多態(tài)性的SNP遺傳變異位置進(jìn)行對(duì)比。SNP通常約為一百萬(wàn),因此如果數(shù)據(jù)庫(kù)包含一百萬(wàn)個(gè)基因組,結(jié)果將是一百萬(wàn)個(gè)百萬(wàn)的矩陣。

        尋找有用的疾病相關(guān)性需要過(guò)濾誤導(dǎo)性相關(guān)性,這一過(guò)程稱為人口分層校正。例如,東亞人經(jīng)常乳糖不耐癥,但他們也往往比北歐人短。對(duì)乳糖不耐受的遺傳相關(guān)性進(jìn)行的初步調(diào)查可能最終會(huì)確定那些高度不足的人。

        群體分層校正通常依賴于稱為主成分分析的算法,其需要涉及整個(gè)SNP對(duì)基因組矩陣的重復(fù)乘法。如果矩陣中的每個(gè)條目都需要為這些乘法中的每一個(gè)都使用其自己的一組Beaver三元組,那么分析一百萬(wàn)個(gè)基因組將非常耗時(shí)。

        但Cho,Berger和Wu找到了一種構(gòu)造乘法序列的方法,這樣許多Beaver三元組只能計(jì)算一次并重復(fù)使用,從而大大降低了計(jì)算的復(fù)雜性。

        他們還使用其他幾種技術(shù)來(lái)加速他們的系統(tǒng)。由于Beaver三元組必須秘密共享,因此Beaver三元組中的每個(gè)數(shù)字都有一個(gè)相關(guān)的隨機(jī)數(shù):在雙服務(wù)器方案中,一個(gè)服務(wù)器將獲得隨機(jī)數(shù),另一個(gè)服務(wù)器將獲得Beaver數(shù)減去隨機(jī)數(shù)。

        在Cho,Berger和Wu的系統(tǒng)中,有一個(gè)服務(wù)器致力于生成Beaver三元組并秘密共享它們。但是,雖然需要將海貍數(shù)量減去相關(guān)的隨機(jī)數(shù)傳輸?shù)竭m當(dāng)?shù)姆?wù)器,但它不需要自己傳輸隨機(jī)數(shù)。相反,它只是共享用于“種子”稱為偽隨機(jī)數(shù)生成器的算法的數(shù)字。然后,接收方服務(wù)器可以自己生成隨機(jī)數(shù),從而節(jié)省了大量的通信帶寬。

        最后,當(dāng)執(zhí)行所有乘法運(yùn)算時(shí),系統(tǒng)實(shí)際上并沒(méi)有使用整個(gè)百萬(wàn)分之一的矩陣。相反,它使用稱為隨機(jī)投影的近似技術(shù)來(lái)降低矩陣,同時(shí)保持最終計(jì)算結(jié)果的準(zhǔn)確性。

        基于這些技術(shù),Cho,Berger和Wu的系統(tǒng)準(zhǔn)確地再現(xiàn)了三個(gè)??已發(fā)表的涉及23,000個(gè)個(gè)體基因組的全基因組關(guān)聯(lián)研究。這些分析的結(jié)果表明該系統(tǒng)應(yīng)該有效地?cái)U(kuò)展到一百萬(wàn)個(gè)基因組。

        鄭重聲明:本文版權(quán)歸原作者所有,轉(zhuǎn)載文章僅為傳播更多信息之目的,如有侵權(quán)行為,請(qǐng)第一時(shí)間聯(lián)系我們修改或刪除,多謝。

        推薦內(nèi)容