综合精品天天夜夜久久,日本中文字幕二区区精品,亚洲欧美中文字幕制服二区,青青青国产爽爽视频免费观看

<sup id="zxca5"></sup>

中國(guó)基因網(wǎng)您的位置：首頁(yè) >基因檢測(cè) >

保護(hù)基因組研究中的機(jī)密性

2019-04-19 11:17:26 ? 來(lái)源：

全基因組關(guān)聯(lián)研究尋找特定遺傳變異與疾病發(fā)病率之間的聯(lián)系，是許多現(xiàn)代生物醫(yī)學(xué)研究的基礎(chǔ)。但基因組信息數(shù)據(jù)庫(kù)會(huì)帶來(lái)隱私風(fēng)險(xiǎn)。從人們的原始基因組數(shù)據(jù)中，可以推斷出他們的姓氏，甚至可能是他們臉上的形狀。許多人不愿意將他們的基因組數(shù)據(jù)貢獻(xiàn)給生物醫(yī)學(xué)研究項(xiàng)目，并且在決定是否授予研究人員訪問(wèn)請(qǐng)求之前，托管大型基因組數(shù)據(jù)庫(kù)的組織可能會(huì)進(jìn)行長(zhǎng)達(dá)數(shù)月的審查。

在今天出現(xiàn)在Nature Biotechnology上的一篇論文中，來(lái)自麻省理工學(xué)院和斯坦福大學(xué)的研究人員提出了一個(gè)新的系統(tǒng)，用于保護(hù)那些將基因組數(shù)據(jù)貢獻(xiàn)給大規(guī)模生物醫(yī)學(xué)研究的人的隱私。早期的加密方法計(jì)算密集程度太高，以至于超過(guò)幾千個(gè)基因組變得非常耗時(shí)，新系統(tǒng)承諾為多達(dá)一百萬(wàn)個(gè)基因組進(jìn)行的研究提供有效的隱私保護(hù)。

“作為生物醫(yī)學(xué)研究人員，我們對(duì)缺乏數(shù)據(jù)和訪問(wèn)控制的存儲(chǔ)庫(kù)感到沮喪，”麻省理工學(xué)院西蒙斯數(shù)學(xué)教授和該論文的相應(yīng)作者Bonnie Berger說(shuō)。“我們期待一個(gè)擁有大量分布式基因組數(shù)據(jù)的未來(lái)，私人擁有自己的個(gè)人基因組，研究所和醫(yī)院都建立自己的私人基因組數(shù)據(jù)庫(kù)。我們的工作提供了一個(gè)匯集大量數(shù)據(jù)的路線圖?；蚪M數(shù)據(jù)，以促進(jìn)科學(xué)進(jìn)步。“

論文的第一作者是麻省理工學(xué)院電子工程和計(jì)算機(jī)科學(xué)研究生Hyunghoon Cho;他和伯杰加入了斯坦福大學(xué)計(jì)算機(jī)科學(xué)研究生David Wu。

系統(tǒng)的核心是一種稱為秘密共享的技術(shù)，它在多個(gè)服務(wù)器之間劃分敏感數(shù)據(jù)。例如，為了存儲(chǔ)數(shù)字x，秘密共享系統(tǒng)可以將隨機(jī)數(shù)r發(fā)送到一個(gè)服務(wù)器而將xr發(fā)送到另一個(gè)服務(wù)器。

兩個(gè)服務(wù)器都不能獨(dú)立地推斷x。但總的來(lái)說(shuō)，他們?nèi)匀豢梢詧?zhí)行有用的操作。如果一個(gè)服務(wù)器存儲(chǔ)了一堆r并將它們加在一起，而另一個(gè)服務(wù)器將所有相應(yīng)的(xr)加起來(lái)，那么共享結(jié)果并將它們加在一起將產(chǎn)生所有x的總和。但是，兩個(gè)服務(wù)器都不會(huì)觀察到任何一個(gè)x的值。

當(dāng)然，如果兩個(gè)服務(wù)器都被黑客攻擊，攻擊者可以重建所有的x。但只要一臺(tái)服務(wù)器值得信賴，系統(tǒng)就是安全的。此外，該原則推廣到多個(gè)服務(wù)器。如果數(shù)據(jù)在四個(gè)服務(wù)器之間分配，則攻擊者必須滲透所有四個(gè)服務(wù)器;黑客攻擊任何三個(gè)都不足以提取任何數(shù)據(jù)。

然而，在這種情況下，乘法比加法更復(fù)雜。乘以兩個(gè)x需要生成三個(gè)隨機(jī)數(shù)- 在密碼學(xué)家唐納德比弗之后，除了r之外，被稱為Beaver三元組。反過(guò)來(lái)，這三個(gè)數(shù)字必須在使用秘密共享的服務(wù)器之間進(jìn)行劃分。在乘法之前將這些數(shù)字的秘密共享分量添加到x和r中會(huì)產(chǎn)生代數(shù)表達(dá)式，其中可以濾除所有添加的隨機(jī)性，僅留下兩個(gè)x的乘積。

全基因組關(guān)聯(lián)研究涉及一個(gè)龐大的表格或矩陣，它將數(shù)據(jù)庫(kù)中的基因組與單核苷酸多態(tài)性的SNP遺傳變異位置進(jìn)行對(duì)比。SNP通常約為一百萬(wàn)，因此如果數(shù)據(jù)庫(kù)包含一百萬(wàn)個(gè)基因組，結(jié)果將是一百萬(wàn)個(gè)百萬(wàn)的矩陣。

尋找有用的疾病相關(guān)性需要過(guò)濾誤導(dǎo)性相關(guān)性，這一過(guò)程稱為人口分層校正。例如，東亞人經(jīng)常乳糖不耐癥，但他們也往往比北歐人短。對(duì)乳糖不耐受的遺傳相關(guān)性進(jìn)行的初步調(diào)查可能最終會(huì)確定那些高度不足的人。

群體分層校正通常依賴于稱為主成分分析的算法，其需要涉及整個(gè)SNP對(duì)基因組矩陣的重復(fù)乘法。如果矩陣中的每個(gè)條目都需要為這些乘法中的每一個(gè)都使用其自己的一組Beaver三元組，那么分析一百萬(wàn)個(gè)基因組將非常耗時(shí)。

但Cho，Berger和Wu找到了一種構(gòu)造乘法序列的方法，這樣許多Beaver三元組只能計(jì)算一次并重復(fù)使用，從而大大降低了計(jì)算的復(fù)雜性。

他們還使用其他幾種技術(shù)來(lái)加速他們的系統(tǒng)。由于Beaver三元組必須秘密共享，因此Beaver三元組中的每個(gè)數(shù)字都有一個(gè)相關(guān)的隨機(jī)數(shù)：在雙服務(wù)器方案中，一個(gè)服務(wù)器將獲得隨機(jī)數(shù)，另一個(gè)服務(wù)器將獲得Beaver數(shù)減去隨機(jī)數(shù)。

在Cho，Berger和Wu的系統(tǒng)中，有一個(gè)服務(wù)器致力于生成Beaver三元組并秘密共享它們。但是，雖然需要將海貍數(shù)量減去相關(guān)的隨機(jī)數(shù)傳輸?shù)竭m當(dāng)?shù)姆?wù)器，但它不需要自己傳輸隨機(jī)數(shù)。相反，它只是共享用于“種子”稱為偽隨機(jī)數(shù)生成器的算法的數(shù)字。然后，接收方服務(wù)器可以自己生成隨機(jī)數(shù)，從而節(jié)省了大量的通信帶寬。

最后，當(dāng)執(zhí)行所有乘法運(yùn)算時(shí)，系統(tǒng)實(shí)際上并沒(méi)有使用整個(gè)百萬(wàn)分之一的矩陣。相反，它使用稱為隨機(jī)投影的近似技術(shù)來(lái)降低矩陣，同時(shí)保持最終計(jì)算結(jié)果的準(zhǔn)確性。

基于這些技術(shù)，Cho，Berger和Wu的系統(tǒng)準(zhǔn)確地再現(xiàn)了三個(gè)??已發(fā)表的涉及23,000個(gè)個(gè)體基因組的全基因組關(guān)聯(lián)研究。這些分析的結(jié)果表明該系統(tǒng)應(yīng)該有效地?cái)U(kuò)展到一百萬(wàn)個(gè)基因組。

鄭重聲明：本文版權(quán)歸原作者所有，轉(zhuǎn)載文章僅為傳播更多信息之目的，如有侵權(quán)行為，請(qǐng)第一時(shí)間聯(lián)系我們修改或刪除，多謝。

推薦內(nèi)容

<menuitem id="kvzld"><blockquote id="kvzld"><dl id="kvzld"></dl></blockquote></menuitem>

<fieldset id="kvzld"><object id="kvzld"><strong id="kvzld"></strong></object></fieldset>

<progress id="kvzld"></progress>