基因組分析工具包4 GATK4 作為開源資源發(fā)布 以加速研究
麻省理工學院和哈佛大學廣泛研究所將在開源軟件許可下發(fā)布業(yè)界領(lǐng)先的Genome Analysis Toolkit第4版。該軟件包名為GATK4,包含新工具和重建架構(gòu)。它目前在Broad Institute的GATK網(wǎng)站上作為alpha預(yù)覽版提供,預(yù)計將在6月中旬發(fā)布測試版。廣泛的工程師今天在Bio-IT World上宣布升級,以及決定將該工具作為開源產(chǎn)品發(fā)布。新版本基于新架構(gòu),允許大量簡化單個工具,并支持Apache SparkTM等性能增強技術(shù)。這個新框架改進了并行化,利用了云部署,并使分析大量基因組數(shù)據(jù)的過程更容易,更快速,更高效。
“我們希望消除傳統(tǒng)的規(guī)模障礙,同時提供我們用戶期望的高水平數(shù)據(jù)質(zhì)量,”Broad的數(shù)據(jù)科學和數(shù)據(jù)工程高級總監(jiān),最初的GATK 軟件包的創(chuàng)建者Eric Banks表示。“由于云計算的迅速普及,研究人員終于可以解決許多阻礙進展的基礎(chǔ)設(shè)施相關(guān)并發(fā)癥,特別是在小型機構(gòu)和創(chuàng)業(yè)公司。”
如今,全球有超過45,000名學術(shù)和商業(yè)用戶依賴GATK,運行數(shù)百萬次分析。GATK是用于鑒定種系DNA和RNAseq數(shù)據(jù)中的SNP和插入缺失的行業(yè)標準。除了改善這些已建立的工具的性能外,GATK4還擴展了這一分析范圍,包括種系數(shù)和結(jié)構(gòu)變異,用于種系和體細胞研究應(yīng)用。
完全開源的軟件
GATK4將作為一個完全開源的產(chǎn)品發(fā)布,部分歸功于Broad Institute和英特爾公司之間的合作,以推進高性能分析,以便研究人員可以研究來自世界各地不同來源的大量基因組數(shù)據(jù)。
在英特爾 - 基因組數(shù)據(jù)工程中心,軟件工程師和研究人員花了幾個月的時間來構(gòu)建,優(yōu)化和廣泛共享新的工具和基礎(chǔ)設(shè)施,以幫助科學家整合和處理基因組數(shù)據(jù)。GATK4受益于此次合作,該合作幫助工程師優(yōu)化了基因組分析的硬件和軟件的最佳實踐,從而可以組合和使用駐留在私有云,公共云和混合云上的研究數(shù)據(jù)集。
“將GATK4作為開源發(fā)布是我們團隊明顯的下一步,”Broad研究所數(shù)據(jù)科學與數(shù)據(jù)工程小組外展與傳播副主任Geraldine Van der Auwera說。“我們相信這是支持社區(qū)的最有效方式,我們希望它能夠繼續(xù)發(fā)展,創(chuàng)新并幫助研究人員獲得對未來人類健康突破至關(guān)重要的見解。” “對于生物醫(yī)學的進步至關(guān)重要,我們用于分析數(shù)百萬人的基因組的軟件是健全且易于理解的,”EMBL-EBI主任,全球基因組學和健康聯(lián)盟(GA4GH)主席Ewan Birney說。 。“使用開源許可證發(fā)布GATK軟件 直接支持全球生物醫(yī)學界的開放式創(chuàng)新,數(shù)據(jù)重用和數(shù)據(jù)重新分析。““GATK工具對種系和癌癥分析至關(guān)重要,”芝加哥大學醫(yī)學系的Robert L. Grossman和生物醫(yī)學信息學專家說。“將GATK4作為一個開源軟件包發(fā)布將提高采用率,并使社區(qū)受益。”
“公開采購GATK對于開放式基因組學和一般的開放式科學來說是一個大問題,”Chan Zuckerberg Initiative(CZI)計算生物學經(jīng)理杰里米·弗里曼說。“它不僅使這個關(guān)鍵工具能夠盡可能廣泛地供受眾使用,重用,檢查和貢獻 - 它為社區(qū)提供了一個強大的示例,說明現(xiàn)有項目如何能夠接受開源。”
“開源代碼是高效生物醫(yī)學研究的基礎(chǔ),”哈佛大學陳氏公共衛(wèi)生學院研究科學家布拉德查普曼說。“它通過消除共享和分發(fā)分析的障礙,實現(xiàn)了可重復(fù)性,重復(fù)使用和重新混合.Broad Institute的GATK團隊在開發(fā)可擴展,敏感和特定的變體調(diào)用算法方面處于領(lǐng)先地位,開源GATK4將允許Blue Collar Bioinformatics等框架制作這些算法??茖W研究界廣泛使用的方法。“
Cloudera的數(shù)據(jù)科學家,Apache Hadoop PMC的成員Tom White說:“Cloudera一直是開源代碼的支持者和信徒。” “我們很高興為GATK代碼庫做出貢獻,使其在Apache Spark和Cloudera上順利運行.GATK的下一階段,由Spark和開源軟件提供支持,將擴大訪問范圍并改善基因組數(shù)據(jù)科學家之間的協(xié)作。 “
“GATK4的開源是基因組學的重要一步,可以為研究,生物技術(shù)和制藥界公開提供可擴展性和性能提升,”英特爾數(shù)據(jù)中心解決方案公司副總裁兼總經(jīng)理Jason Waxman說。“GATK4在英特爾的新參考架構(gòu)上運行時,與早期版本的軟件相比,可以實現(xiàn)5倍的加速。”
“我們谷歌很高興看到這個新版本,”Google云端醫(yī)療保健工程負責人Ilia Tulchinsky說。“過去三年來,我們一直在與Broad研究所合作,以加強Google Cloud Platform上的基因組處理。作為開源技術(shù)的堅定支持者,我們相信以這種方式提供GATK將有助于各地的基因組科學家使用它。作為英特爾的合作伙伴,我們特別期待讓研究人員使用即將推出的英特爾至強處理器可擴展系列在Google Cloud上運行GATK4。
“GATK是生命科學中使用最廣泛的軟件包之一,我們的團隊與Broad合作非常有效地加速了它在Azure上的使用,”微軟人工智能與研究總監(jiān)Geralyn Miller說。“這個新模型將極大地推動這項工作的進展,我們很高興繼續(xù)并在Azure上圍繞GATK擴展我們的工作。”
“隨著GATK4的開源推出,有機會創(chuàng)建一個可以協(xié)同工作并提升生物信息學藝術(shù)水平的全球社區(qū),”阿里巴巴集團云計算部門阿里巴巴云首席架構(gòu)師Hong Tang表示。“我們期待與Broad Institute密切合作,將基于云的GATK服務(wù)引入中國的基因組學客戶,以及正在進行的GATK研發(fā)。”
除了提供GATK4作為開源工具包之外,Broad Institute還將繼續(xù)在其廣受歡迎的用戶支持論壇上提供用戶支持,培訓和外展服務(wù)。與許多Broad Institute的基因組分析工具一樣,GATK4將通過Broad Institute的基于云的分析平臺FireCloud提供。
推薦內(nèi)容
-
壹點送崗|118人!山東省康復(fù)研究中心公開招聘工作人員
壹點送崗|118人!山東省康復(fù)研究中心公開招聘工作人員 記者 趙清華 通訊員 毛可超招聘單位簡介山東省康復(fù)研究中心(山東省康復(fù)醫(yī)
-
豐臺區(qū)新增確診病例8例 無癥狀感染者2例 新增病例相關(guān)風險點位
豐臺區(qū)新增確診病例8例 無癥狀感染者2例 新增病例相關(guān)風險點位通報 北京青年報記者從豐臺區(qū)疾控獲悉,5月15日15時至5月16日15時,豐
-
食物“聞著臭、吃著香”?和人體嗅覺有關(guān)? 請檫亮眼睛
食物“聞著臭、吃著香”?和人體嗅覺有關(guān)? 請檫亮眼睛隨著互聯(lián)網(wǎng)時代的到來,訊息傳播效率飛速提高,但也出現(xiàn)了很多不實消息被誤傳的情...
-
別嚇我!轉(zhuǎn)呼啦圈會損傷內(nèi)臟? 真實情況是這樣
別嚇我!轉(zhuǎn)呼啦圈會損傷內(nèi)臟? 真實情況是這樣全民自媒體時代,消息的傳播方式多種多樣,但也出現(xiàn)了很多不實消息被誤傳的情況。因此我們在
-
安徽界首刑案死者系一家四口 最小的還在讀幼兒園
又是一家四口不幸離世是怎么回事?前幾日連云港一家四口在家中死亡引起社會各界關(guān)注,今日又有一家四口不幸離世。9月27號,安徽省界首市任寨
-
全球化健康和疾病遺傳預(yù)測的挑戰(zhàn)
全基因組關(guān)聯(lián)研究(GWAS)為我們提供了對遺傳性狀和疾病的前所未有的洞察力。然而,由于絕大多數(shù)研究使用了歐洲人群,GWAS的結(jié)果描繪了偏見,
-
細胞周期蛋白A2誘導心肌梗死后心臟再生
心肌梗塞后之所以會發(fā)生這種情況,部分原因是心肌細胞終末分化并且在血液被阻塞到心臟后無法增殖。這就是死亡原因。哪些細胞可以被刺激...
-
唱響新時代的青春之歌——以習近平同志為核心的黨中央關(guān)心青年和
唱響新時代的青春之歌——以習近平同志為核心的黨中央關(guān)心青年和青年工作紀實 新華社北京5月4日電 題:唱響新時代的青春之歌——以習...
-
德克薩斯A&M研究人員獲得開發(fā)超級驅(qū)蟲防污食品表面的資助
德克薩斯A&M AgriLife研究和德克薩斯A&M工程實驗站TEES最近獲得了美國農(nóng)業(yè)部國家食品和農(nóng)業(yè)研究所的資助,用于研究和開發(fā)食品的超級驅(qū)蟲和