研究人員在DNA上存儲(chǔ)計(jì)算機(jī)操作系統(tǒng)和短片
人類可能很快會(huì)產(chǎn)生比硬盤驅(qū)動(dòng)器或磁帶可以處理的數(shù)據(jù)更多的數(shù)據(jù),這個(gè)問題讓科學(xué)家轉(zhuǎn)向大自然的信息存儲(chǔ)DNA解決方案。在科學(xué)的一項(xiàng)新研究中,哥倫比亞大學(xué)和紐約基因組中心(NYGC)的一對(duì)研究人員表明,設(shè)計(jì)用于在手機(jī)上傳輸視頻的算法可以通過將更多信息壓縮到其四個(gè)基本核苷酸中來解鎖DNA幾乎完全的存儲(chǔ)潛力。他們證明這項(xiàng)技術(shù)也非??煽俊NA是一種理想的儲(chǔ)存介質(zhì),因?yàn)樗浅>o湊,如果保存在陰涼干燥的地方可以持續(xù)數(shù)十萬年,最近從一個(gè)43萬年前發(fā)現(xiàn)的人類祖先的骨骼中恢復(fù)DNA就證明了這一點(diǎn)。西班牙的一個(gè)洞穴。
研究報(bào)告的共同作者,哥倫比亞工程公司的哥倫比亞工程公司的計(jì)算機(jī)科學(xué)教授Yaniv Erlich說:“DNA不會(huì)隨著時(shí)間的推移而像盒式錄音帶和CD那樣降級(jí),而且不會(huì)過時(shí) - 如果確實(shí)如此,我們就會(huì)遇到更大的問題。”數(shù)據(jù)科學(xué)研究所,以及NYGC的核心成員。
Erlich和他的同事,NYGC的副科學(xué)家Dina Zielinski選擇了六個(gè)文件來編碼或?qū)懭隓NA:一個(gè)完整??的計(jì)算機(jī)操作系統(tǒng),一部1895年的法國(guó)電影,“在La Ciotat到達(dá)火車”,50美元的亞馬遜禮物卡片,計(jì)算機(jī)病毒,先鋒牌匾和信息理論家克勞德·香農(nóng)1948年的一項(xiàng)研究。
他們將文件壓縮為主文件,然后將數(shù)據(jù)拆分為由1和0組成的短二進(jìn)制代碼串。使用稱為噴泉碼的擦除校正算法,他們將字符串隨機(jī)打包成所謂的液滴,并將每個(gè)液滴中的1和0映射到DNA中的4個(gè)核苷酸堿基:A,G,C和T.算法刪除了字母已知可以創(chuàng)建錯(cuò)誤的組合,并為每個(gè)Droplet添加條形碼以幫助以后重新組合文件。
總之,他們生成了72,000條DNA鏈的數(shù)字列表,每條長(zhǎng)度為200個(gè)堿基,并將其以文本形式發(fā)送給舊金山DNA合成創(chuàng)業(yè)公司Twist Bioscience,專門將數(shù)字?jǐn)?shù)據(jù)轉(zhuǎn)換為生物數(shù)據(jù)。兩周后,他們收到一個(gè)裝有DNA分子斑點(diǎn)的小瓶。
為了檢索他們的文件,他們使用現(xiàn)代測(cè)序技術(shù)來讀取DNA鏈,然后使用軟件將遺傳密碼翻譯成二進(jìn)制。研究報(bào)告稱,他們?cè)跊]有錯(cuò)誤的情況下恢復(fù)了文件。(在這個(gè)簡(jiǎn)短的演示中,Erlich在虛擬機(jī)上打開他的歸檔操作系統(tǒng)并玩一個(gè)Minesweeper游戲來慶祝。)
他們還證明,通過聚合酶鏈?zhǔn)椒磻?yīng)(PCR)將DNA樣本相乘,可以使用編碼技術(shù)創(chuàng)建幾乎無限數(shù)量的文件副本,這些副本,甚至副本的副本等都可以無錯(cuò)誤地恢復(fù)。
最后,研究人員表明,他們的編碼策略在一克DNA上包含215PB的數(shù)據(jù) - 比哈佛大學(xué)的先驅(qū)研究人員George Church和歐洲生物信息學(xué)研究所的Nick Goldman和Ewan Birney所發(fā)表的方法多100倍。“我們相信這是有史以來密度最高的數(shù)據(jù)存儲(chǔ)設(shè)備,”Erlich說。
理論上,DNA數(shù)據(jù)存儲(chǔ)的容量限于每個(gè)核苷酸的兩個(gè)二進(jìn)制數(shù)字,但DNA本身的生物學(xué)限制以及包含冗余信息以重新組裝和讀取片段的需要隨后將其容量降低至每個(gè)核苷酸堿基1.8個(gè)二進(jìn)制數(shù)字。
該團(tuán)隊(duì)的見解是應(yīng)用噴泉代碼,這是Erlich從研究生院學(xué)到的一種技術(shù),使閱讀和寫作過程更加高效。利用他們的DNA Fountain技術(shù),Erlich和Zielinski在每個(gè)堿基核苷酸中平均包含1.6位。這比以前發(fā)布的方法至少多60%的數(shù)據(jù),接近1.8位的限制。
成本仍然是一個(gè)障礙。研究人員花了7,000美元來合成他們用于存檔2兆字節(jié)數(shù)據(jù)的DNA,另外花費(fèi)2000美元來閱讀它。雖然DNA測(cè)序的價(jià)格呈指數(shù)下降,但對(duì)于DNA合成的需求可能并不相同,加州大學(xué)洛杉磯分校的生物化學(xué)教授斯科索里說,他沒有參與這項(xiàng)研究。“投資者可能不愿意冒很多錢來降低成本,”他說。
但是,如果生成質(zhì)量較低的分子,DNA合成的價(jià)格可以大大降低,并且像DNA Fountain這樣的編碼策略被用來修復(fù)分子錯(cuò)誤,Erlich說。“我們可以在計(jì)算機(jī)上做更多的繁重工作,以減輕時(shí)間密集型分子編碼的負(fù)擔(dān),”他說。
推薦內(nèi)容
-
偷內(nèi)褲的賊是什么心理
社會(huì)的發(fā)展越來越快,大家現(xiàn)在也慢慢開始關(guān)注一個(gè)人的心理健康。因?yàn)橥饨缡挛锏木薮笞兓芏嗳烁簧献兓哪_步就會(huì)產(chǎn)生心理落差感從...
-
為什么吃燕窩的人皮膚更白嫩?來看學(xué)者的建議
隨著互聯(lián)網(wǎng)的快速發(fā)展,我們?cè)讷@取信息的時(shí)候很容易被帶跑方向。有時(shí)候真相也許并不是網(wǎng)上說的那樣,所以我們必須要有自己的判斷和獨(dú)立...
-
“1月26日起,酒駕將被直接解雇”? 確有其事?
“1月26日起,酒駕將被直接解雇”? 確有其事?隨著互聯(lián)網(wǎng)時(shí)代的到來,信息傳播速度越來越快,但也出現(xiàn)了很多不實(shí)消息被誤傳的情況。所...
-
索爾克研究所從赫爾姆斯利慈善信托基金獲得2500萬美元的資助
索爾克生物研究所(Salk Institute for Biological Studies)獲得了2500萬美元的資助,這是該研究所56年歷史上收到的最大一筆研究贈(zèng)款的