基因組分析工具包4(GATK4)作為開源資源發(fā)布以加速研究
麻省理工學院和哈佛大學Broad研究所將在開源軟件許可下發(fā)布業(yè)界領先的Genome Analysis Toolkit第4版。該軟件包名為GATK4,包含新工具和重建架構。它目前在Broad Institute的GATK網站上作為alpha預覽版提供,預計將在6月中旬發(fā)布測試版。廣泛的工程師今天在Bio-IT World上宣布升級,以及決定將該工具作為開源產品發(fā)布。
新版本基于新架構,允許大量簡化單個工具,并支持Apache SparkTM等性能增強技術。這個新框架改進了并行化,利用了云部署,并使分析大量基因組數據的過程更容易,更快速,更高效。
“我們希望消除傳統的規(guī)模障礙,同時提供我們用戶期望的高水平數據質量,”Broad的數據科學和數據工程高級總監(jiān),最初的GATK軟件包的創(chuàng)建者Eric Banks表示。“由于云計算的迅速普及,研究人員終于可以解決許多阻礙進步的基礎設施相關并發(fā)癥,特別是在較小的機構和創(chuàng)業(yè)公司。”
如今,全球有超過45,000名學術和商業(yè)用戶依賴GATK,進行數百萬次分析。GATK是用于鑒定種系DNA和RNAseq數據中的SNP和插入缺失的行業(yè)標準。除了改善這些已建立的工具的性能外,GATK4還擴展了這一分析范圍,包括種系數和結構變異,用于種系和體細胞研究應用。
完全開源的軟件
GATK4將作為一個完全開源的產品發(fā)布,部分歸功于Broad Institute和英特爾公司之間的合作,以推進高性能分析,以便研究人員可以研究來自世界各地不同來源的大量基因組數據。
在英特爾 - 基因組數據工程中心,軟件工程師和研究人員花了幾個月的時間來構建,優(yōu)化和廣泛共享新的工具和基礎設施,以幫助科學家整合和處理基因組數據。GATK4從這一合作中受益,該合作幫助工程師優(yōu)化了用于基因組分析的硬件和軟件的最佳實踐,從而可以組合和使用駐留在私有云,公共云和混合云上的研究數據集。
“將GATK4作為開源發(fā)布是我們團隊明顯的下一步,”Broad研究所數據科學與數據工程小組外展與傳播副主任Geraldine Van der Auwera說。“我們相信這是支持社區(qū)的最有效方式,我們希望它能夠繼續(xù)發(fā)展,創(chuàng)新并幫助研究人員獲得對未來人類健康突破至關重要的見解。”“生物醫(yī)學取得進展至關重要,我們用于分析數百萬人基因組的軟件是健全且易于理解的,”EMBL-EBI主任,全球基因組學和健康聯盟(GA4GH)主席Ewan Birney說。 。“使用開源許可證發(fā)布GATK軟件直接支持全球生物醫(yī)學界的開放式創(chuàng)新,數據重用和數據重新分析。“
“GATK工具對種系和癌癥分析至關重要,”芝加哥大學醫(yī)學系的Robert L. Grossman和生物醫(yī)學信息學專家說。“將GATK4作為一個開源軟件包發(fā)布將提高采用率,并使社區(qū)受益。”
“開源基因組學和開放式科學一般來說,開源GATK是一件大事,”Chan Zuckerberg Initiative(CZI)計算生物學經理Jeremy Freeman說。“它不僅使這個關鍵工具能夠盡可能廣泛地供受眾使用,重用,檢查和貢獻 - 它為社區(qū)提供了一個強大的示例,說明現有項目如何能夠接受開源。”
“開源代碼是高效生物醫(yī)學研究的基礎,”哈佛大學陳氏公共衛(wèi)生學院研究科學家布拉德查普曼說。“它通過消除共享和分發(fā)分析的障礙,實現了重復性,重用和重新混合.Broad Institute的GATK團隊領導開發(fā)可擴展,敏感和特定的變體調用算法,開源GATK4將允許Blue Collar Bioinformatics等框架制作這些算法科學研究界廣泛使用的方法。“
Cloudera的數據科學家,Apache Hadoop PMC的成員湯姆懷特說:“Cloudera一直是開源代碼的支持者和信徒。”“我們很高興為GATK代碼庫做出貢獻,使其在Apache Spark和Cloudera上順利運行.GATK的下一階段,由Spark和開源軟件提供支持,將擴大訪問范圍并改善基因組數據科學家之間的協作。 “
“GATK4的開源是基因組學的重要一步,可以為研究,生物技術和制藥界公開提供可擴展性和性能提升,”英特爾數據中心解決方案公司副總裁兼總經理Jason Waxman說。“GATK4在英特爾的新參考架構上運行時,與早期版本的軟件相比,可以實現5倍的加速。”
“我們谷歌很高興看到這個新版本,”Google云端醫(yī)療保健工程負責人Ilia Tulchinsky說。“過去三年來,我們一直在與Broad研究所合作,以加強Google Cloud Platform上的基因組處理。作為開源技術的堅定支持者,我們相信以這種方式提供GATK將有助于各地的基因組科學家使用它。作為英特爾的合作伙伴,我們特別期待讓研究人員使用即將推出的英特爾至強處理器可擴展系列在谷歌云上運行GATK4。
“GATK是生命科學中使用最廣泛的軟件包之一,我們的團隊與Broad合作非常有效地加速了它在Azure上的使用,”微軟人工智能與研究總監(jiān)Geralyn Miller說。“這個新模型將極大地推動這項工作的進展,我們很高興繼續(xù)并在Azure上圍繞GATK擴展我們的工作。”
“隨著GATK4的開源推出,有機會創(chuàng)建一個可以協同工作并提升生物信息學藝術水平的全球社區(qū),”阿里巴巴集團云計算部門阿里云的首席架構師洪唐表示。“我們期待與Broad Institute密切合作,將基于云的GATK服務引入中國的基因組學客戶,以及正在進行的GATK研發(fā)。”
除了提供GATK4作為開源工具包之外,Broad Institute還將繼續(xù)在其廣受歡迎的用戶支持論壇上提供用戶支持,培訓和外展服務。與許多Broad Institute的基因組分析工具一樣,GATK4將通過Broad Institute的基于云的分析平臺FireCloud提供。
undefined
推薦內容
-
蜂蜜水可以解酒?你知道哪些
互聯網時代,每個人都是信息傳播者,但是我們必須清楚一點:在沒有獲得真正證實的消息之前,千萬不能隨意散播謠言,很容易造成以訛傳訛...
-
看了這篇文章,再也不用擔心膽固醇了?來聽聽專業(yè)人士怎么說
生活中我們經常會聽見各種各樣的流言,但是只要我們用心去思考和辨認其實 不難發(fā)現這些謠言有很多破綻。所以今天,小編照常給大家辟謠一則
-
蝦皮能補鈣?具體什么情況呢
當我們不知道一件事真假的時候,不防多等等官方的回應。因為信息碎片化,很多小伙伴現在上網很容易只看到事情的一面就下定論,其實很多...
-
心理知識:偷走幸福的消極心理_偷走幸福有何消極心理
隨著社會壓力的不斷加大,人們現在把越來越多的目光放到了一個人的心理情況上。確實,每個人的抗壓指數是有限的,一個平時看著正常的人...
-
心理知識:警惕!失眠是憂郁癥前兆
隨著社會壓力的不斷加大,人們現在把越來越多的目光放到了一個人的心理情況上。確實,每個人的抗壓指數是有限的,一個平時看著正常的人...
-
新的研究發(fā)現細胞對疾病的反應并不總是直的
一項新的研究發(fā)現,細胞采取的應對挑戰(zhàn)的步驟比以前認為的要復雜得多。該研究調查了一個與癌癥,病毒感染和糖尿病以及帕金森癥和Lou Gehri
-
益生菌可以診斷預防和治療感染
麻省理工學院的工程師開發(fā)了一種天然和工程菌的益生菌混合物,用于診斷和治療霍亂,這是一種導致嚴重脫水的腸道感染?;魜y疫情通常是由...
-
科學家為人類表觀基因組創(chuàng)造了一個新的路線圖
人類基因組序列是固定的,這意味著身體每個細胞中的基因組應該具有相同的DNA代碼。那么,什么使眼睛細胞與肝細胞不同?不同之處在于如何調節(jié)
-
研究人員發(fā)現新的抗生素抗性基因
查爾姆斯理工大學教授Erik Kristiansson及其合作者已經確定了70多種新的金屬-β-內酰胺酶基因,這些基因使細菌對最后抗生素產生抗藥性
-
雞肉里有激素,孩子吃多會早熟是真的嗎?其實真相是...
互聯網時代,每個人都是信息傳播者,但是我們必須清楚一點:在沒有獲得真正證實的消息之前,千萬不能隨意散播謠言,很容易造成以訛傳訛...