科技強企!人和未來領(lǐng)跑國內(nèi)基因組數(shù)據(jù)計算加速軟件市場
科技強企!人和未來領(lǐng)跑國內(nèi)基因組數(shù)據(jù)計算加速軟件市場
原標題:科技強企!人和未來領(lǐng)跑國內(nèi)基因組數(shù)據(jù)計算加速軟件市場
作為數(shù)字經(jīng)濟時代的核心生產(chǎn)力,大數(shù)據(jù)計算加速已經(jīng)成為促進多個行業(yè)發(fā)展的重要基礎(chǔ)設(shè)施。隨著測序技術(shù)不斷升級,測序通量越來越高,測序成本直線下降……基因組數(shù)據(jù)正以超摩爾定律增長。如何將基因測序的原始數(shù)據(jù)讀取出來、數(shù)字化并對其進行相應(yīng)的解讀?是制約基因行業(yè)快速發(fā)展的瓶頸,也是激勵行業(yè)科研人員持續(xù)進步、不斷創(chuàng)新的契機。
基因組數(shù)據(jù)有多“大”?
從生物學(xué)上講,基因組數(shù)據(jù)的大小一般與其復(fù)雜性、等級高低相關(guān)。哺乳類動物的基因組數(shù)據(jù)大于鳥類,鳥類大于真菌,原核生物大于病毒。植物由于是多倍體,而成為生物界最特殊的存在。它的基因組測序數(shù)據(jù)量比較大,部分植物的基因組學(xué)數(shù)據(jù)甚至要大于人類。例如:單個人類的基因組數(shù)據(jù)大約為3Gb;豬的全基因組和人的基因組大小接近,約為2.51Gb;小麥為異源多倍體基因組,數(shù)據(jù)大小約17 Gb,是人類的5~6倍。全球有近70億人口,這會產(chǎn)生多大的數(shù)據(jù)量,可想而知。
當前,目前已經(jīng)普及商用的高通量基因測序儀單臺每天產(chǎn)生的測序數(shù)據(jù)可高達6TB,每年各測序儀新增下機的數(shù)據(jù)則高達數(shù)百PB。有了這些大數(shù)據(jù),我們就能夠從分子水平上了解物種生長、發(fā)育、正常生理活動的本質(zhì)和基礎(chǔ),還能夠通過對比健康與患病物種基因組學(xué)數(shù)據(jù)的差異找到各種疾病在分子水平的病因,從而針對性地進行新藥研發(fā)和改良育種。相應(yīng)的,數(shù)據(jù)量越大分析難度越高,數(shù)據(jù)解讀的效率遠遠跟不上數(shù)據(jù)的產(chǎn)出速度,為基因行業(yè)甚至是整個生命科學(xué)的高質(zhì)量發(fā)展帶來了極大的挑戰(zhàn)。
基因組數(shù)據(jù)分析有多“難”?
隨著測序技術(shù)的發(fā)展,測序價格越來越低。人類全基因組測序的成本已由2007年時的100萬美元降低到1000美元以下。與此同時,大量測序數(shù)據(jù)的積累讓除測序外的數(shù)據(jù)研究成本增高,后續(xù)數(shù)據(jù)存儲、傳輸、計算、應(yīng)用對各生物院校、實驗室及醫(yī)療機構(gòu)的計算機配置提出了更高的要求。動輒幾十萬、幾百萬甚至上千萬的硬件投入,讓眾多科研單位不堪重負。
而基因組數(shù)據(jù)分析的“難”,不僅僅難在基礎(chǔ)設(shè)施的采購成本過高,也難在數(shù)據(jù)處理過程的繁雜。以當前的技術(shù)條件,基因數(shù)據(jù)的分析過程包括:1.樣本上機測序,即將化學(xué)信號轉(zhuǎn)換為數(shù)字信號;2.原始數(shù)據(jù)下機,將數(shù)據(jù)記錄成響應(yīng)的數(shù)據(jù)文本格式后,對其進行解讀、對比、分析,以此來知道樣本所對應(yīng)的物種的表型是什么?為什么可以抗病蟲害等。同時,在人類中知道患者從基因?qū)用鎭斫忉尀楹螘疾??患的什么病?怎么治療和改善?.最終形成數(shù)據(jù)交付報告。根據(jù)應(yīng)用場景的不同,這一過程需要用到生物學(xué)、醫(yī)學(xué)、農(nóng)學(xué)、統(tǒng)計學(xué)、計算機學(xué)等專業(yè)知識,涉及到的分析方法、軟件、算法非常多。
基于GTX.CAT的基因組數(shù)據(jù)分析解決方案
GTX.CAT( Computational Acceleration Toolkits)是人和未來實驗室(GTX LAB)高性能基因組計算加速方案。GTX.CAT是一組計算高效、性能卓越、與工業(yè)標準高度一致的生物信息二級分析軟件工具集,集成了DNA序列比對、BAM預(yù)處理、BAM數(shù)據(jù)質(zhì)控、變異檢測等功能模塊,完全遵循行業(yè)接受度最高的BWA-GATK最佳實踐流程,提供了一套基因組數(shù)據(jù)分析全流程的完整解決方案。
GTX.CAT為純軟件解決方案,支持本地部署、云端部署及多節(jié)點部署。和需依賴新增異構(gòu)計算硬件進行加速的產(chǎn)品相比,GTX.CAT無須確認每臺服務(wù)器有空余PCIE插槽,同時也不需要每臺服務(wù)器單獨作部署。可輕松實現(xiàn)在集群上進行部署,能大大節(jié)省計算成本,提高計算效率,單位投入硬件成本獲得高性價比加速效果。
GTX.CAT支持胚系突變檢測、腫瘤體細胞突變檢測等數(shù)據(jù)的高速比對分析,擁有豐富的質(zhì)控模塊,支持大規(guī)模群體聯(lián)合分型,與BWA-GATK標準流程一致性達到99.7%以上,結(jié)果精準可靠。
責任編輯:
推薦內(nèi)容
-
狐大醫(yī)|阿司匹林不是萬能神藥,這4類人吃了會有反作用
狐大醫(yī)|阿司匹林不是萬能神藥,這4類人吃了會有反作用 原標題:狐大醫(yī)|阿司匹林不是萬能神藥,這4類人吃
-
7月24日廣東疫情實時數(shù)據(jù)公布:廣東新增境外輸入確診5例
廣東23日新增境外輸入確診5例 分別為廣州、佛山和肇慶報告。那么,對于廣東疫情的這個話題,今天的你是否也在關(guān)注著?究竟什么情況?下面跟
-
大規(guī)模研究確定了玉米根際的核心微生物群落
植物的健康不僅受到水和溫度等條件的影響,還受到其根部周圍的微生物的影響。根據(jù)已知的微生物群落,根際微生物組調(diào)節(jié)植物從土壤中獲得...
-
用62天ECMO換肺男子能自主鍛煉了 ECMO是什么?
今天一則關(guān)于用62天ECMO換肺男子能自主鍛煉了的相關(guān)消息引起了網(wǎng)友的關(guān)注,想必大家對于什么是ECMO一事是非常感興趣的,既然大家都想要了解
-
《以你的心詮釋我的愛》第一季完結(jié) 泰劇最火的男男劇有哪些?
泰國一直以來是耽美劇的高產(chǎn)大國,那么,在2020年最火的1部泰劇男男劇是什么呢?下面跟小編一起來了解下這個好看的同性戀題材泰劇吧!泰劇《以
-
篩查肺癌,哪種檢查最準確?
篩查肺癌,哪種檢查最準確? 原標題:篩查肺癌,哪種檢查最準確?
-
醫(yī)院在歐洲引起極度抗藥性細菌的傳播
新的研究發(fā)現(xiàn),抗生素耐藥的肺炎克雷伯菌(Klebsiella pneumoniae)是一種可引起人類呼吸道和血流感染的機會性病原體,正在歐洲的醫(yī)院中傳播
-
12月2日大連封控區(qū)管控區(qū)疫情消息公布 大連新增9例本土確診病
大連市9例本土確診病例和2例本土無癥狀感染者今日出院。據(jù)消息顯示,記者從大連市衛(wèi)生健康委獲悉,12月2日,大連有9例本土確診患者和2例本
-
三星堆祭祀坑出土超120根象牙 三星堆究竟是誰的墓?
三星堆祭祀坑出土超120根象牙,為何上面蓋濕毛巾?而今天的你是否有在關(guān)注三星堆祭祀坑出土超120根象牙的這個話題?具體是什么情況呢?下面跟小
-
5月12日重慶市新冠肺炎疫情防控工作新聞發(fā)布會情況通報
5月12日重慶市新冠肺炎疫情防控工作新聞發(fā)布會情況通報 (來源:重慶衛(wèi)生健康) 原標