综合精品天天夜夜久久,日本中文字幕二区区精品,亚洲欧美中文字幕制服二区,青青青国产爽爽视频免费观看

        中國基因網(wǎng)您的位置:首頁 >國外研究 >

        科技強企!人和未來領(lǐng)跑國內(nèi)基因組數(shù)據(jù)計算加速軟件市場

        科技強企!人和未來領(lǐng)跑國內(nèi)基因組數(shù)據(jù)計算加速軟件市場

        科技強企!人和未來領(lǐng)跑國內(nèi)基因組數(shù)據(jù)計算加速軟件市場

        原標題:科技強企!人和未來領(lǐng)跑國內(nèi)基因組數(shù)據(jù)計算加速軟件市場

        作為數(shù)字經(jīng)濟時代的核心生產(chǎn)力,大數(shù)據(jù)計算加速已經(jīng)成為促進多個行業(yè)發(fā)展的重要基礎(chǔ)設(shè)施。隨著測序技術(shù)不斷升級,測序通量越來越高,測序成本直線下降……基因組數(shù)據(jù)正以超摩爾定律增長。如何將基因測序的原始數(shù)據(jù)讀取出來、數(shù)字化并對其進行相應(yīng)的解讀?是制約基因行業(yè)快速發(fā)展的瓶頸,也是激勵行業(yè)科研人員持續(xù)進步、不斷創(chuàng)新的契機。

        基因組數(shù)據(jù)有多“大”?

        從生物學(xué)上講,基因組數(shù)據(jù)的大小一般與其復(fù)雜性、等級高低相關(guān)。哺乳類動物的基因組數(shù)據(jù)大于鳥類,鳥類大于真菌,原核生物大于病毒。植物由于是多倍體,而成為生物界最特殊的存在。它的基因組測序數(shù)據(jù)量比較大,部分植物的基因組學(xué)數(shù)據(jù)甚至要大于人類。例如:單個人類的基因組數(shù)據(jù)大約為3Gb;豬的全基因組和人的基因組大小接近,約為2.51Gb;小麥為異源多倍體基因組,數(shù)據(jù)大小約17 Gb,是人類的5~6倍。全球有近70億人口,這會產(chǎn)生多大的數(shù)據(jù)量,可想而知。

        當前,目前已經(jīng)普及商用的高通量基因測序儀單臺每天產(chǎn)生的測序數(shù)據(jù)可高達6TB,每年各測序儀新增下機的數(shù)據(jù)則高達數(shù)百PB。有了這些大數(shù)據(jù),我們就能夠從分子水平上了解物種生長、發(fā)育、正常生理活動的本質(zhì)和基礎(chǔ),還能夠通過對比健康與患病物種基因組學(xué)數(shù)據(jù)的差異找到各種疾病在分子水平的病因,從而針對性地進行新藥研發(fā)和改良育種。相應(yīng)的,數(shù)據(jù)量越大分析難度越高,數(shù)據(jù)解讀的效率遠遠跟不上數(shù)據(jù)的產(chǎn)出速度,為基因行業(yè)甚至是整個生命科學(xué)的高質(zhì)量發(fā)展帶來了極大的挑戰(zhàn)。

        基因組數(shù)據(jù)分析有多“難”?

        隨著測序技術(shù)的發(fā)展,測序價格越來越低。人類全基因組測序的成本已由2007年時的100萬美元降低到1000美元以下。與此同時,大量測序數(shù)據(jù)的積累讓除測序外的數(shù)據(jù)研究成本增高,后續(xù)數(shù)據(jù)存儲、傳輸、計算、應(yīng)用對各生物院校、實驗室及醫(yī)療機構(gòu)的計算機配置提出了更高的要求。動輒幾十萬、幾百萬甚至上千萬的硬件投入,讓眾多科研單位不堪重負。

        而基因組數(shù)據(jù)分析的“難”,不僅僅難在基礎(chǔ)設(shè)施的采購成本過高,也難在數(shù)據(jù)處理過程的繁雜。以當前的技術(shù)條件,基因數(shù)據(jù)的分析過程包括:1.樣本上機測序,即將化學(xué)信號轉(zhuǎn)換為數(shù)字信號;2.原始數(shù)據(jù)下機,將數(shù)據(jù)記錄成響應(yīng)的數(shù)據(jù)文本格式后,對其進行解讀、對比、分析,以此來知道樣本所對應(yīng)的物種的表型是什么?為什么可以抗病蟲害等。同時,在人類中知道患者從基因?qū)用鎭斫忉尀楹螘疾??患的什么病?怎么治療和改善?.最終形成數(shù)據(jù)交付報告。根據(jù)應(yīng)用場景的不同,這一過程需要用到生物學(xué)、醫(yī)學(xué)、農(nóng)學(xué)、統(tǒng)計學(xué)、計算機學(xué)等專業(yè)知識,涉及到的分析方法、軟件、算法非常多。

        基于GTX.CAT的基因組數(shù)據(jù)分析解決方案

        GTX.CAT( Computational Acceleration Toolkits)是人和未來實驗室(GTX LAB)高性能基因組計算加速方案。GTX.CAT是一組計算高效、性能卓越、與工業(yè)標準高度一致的生物信息二級分析軟件工具集,集成了DNA序列比對、BAM預(yù)處理、BAM數(shù)據(jù)質(zhì)控、變異檢測等功能模塊,完全遵循行業(yè)接受度最高的BWA-GATK最佳實踐流程,提供了一套基因組數(shù)據(jù)分析全流程的完整解決方案。

        GTX.CAT為純軟件解決方案,支持本地部署、云端部署及多節(jié)點部署。和需依賴新增異構(gòu)計算硬件進行加速的產(chǎn)品相比,GTX.CAT無須確認每臺服務(wù)器有空余PCIE插槽,同時也不需要每臺服務(wù)器單獨作部署。可輕松實現(xiàn)在集群上進行部署,能大大節(jié)省計算成本,提高計算效率,單位投入硬件成本獲得高性價比加速效果。

        GTX.CAT支持胚系突變檢測、腫瘤體細胞突變檢測等數(shù)據(jù)的高速比對分析,擁有豐富的質(zhì)控模塊,支持大規(guī)模群體聯(lián)合分型,與BWA-GATK標準流程一致性達到99.7%以上,結(jié)果精準可靠。

        責任編輯:

        鄭重聲明:本文版權(quán)歸原作者所有,轉(zhuǎn)載文章僅為傳播更多信息之目的,如有侵權(quán)行為,請第一時間聯(lián)系我們修改或刪除,多謝。

        推薦內(nèi)容