综合精品天天夜夜久久,日本中文字幕二区区精品,亚洲欧美中文字幕制服二区,青青青国产爽爽视频免费观看

        中國基因網您的位置:首頁 >基因科普 >

        基因組分析工具包4(GATK4)作為開源資源發(fā)布以加速研究

        麻省理工學院和哈佛大學Broad研究所將在開源軟件許可下發(fā)布業(yè)界領先的Genome Analysis Toolkit第4版。該軟件包名為GATK4,包含新工具和重建架構。它目前在Broad Institute的GATK網站上作為alpha預覽版提供,預計將在6月中旬發(fā)布測試版。廣泛的工程師今天在Bio-IT World上宣布升級,以及決定將該工具作為開源產品發(fā)布。

        基因組分析工具包4(GATK4)作為開源資源發(fā)布以加速研究

        新版本基于新架構,允許大量簡化單個工具,并支持Apache SparkTM等性能增強技術。這個新框架改進了并行化,利用了云部署,并使分析大量基因組數據的過程更容易,更快速,更高效。

        “我們希望消除傳統的規(guī)模障礙,同時提供我們用戶期望的高水平數據質量,”Broad的數據科學和數據工程高級總監(jiān),最初的GATK軟件包的創(chuàng)建者Eric Banks表示。“由于云計算的迅速普及,研究人員終于可以解決許多阻礙進步的基礎設施相關并發(fā)癥,特別是在較小的機構和創(chuàng)業(yè)公司。”

        如今,全球有超過45,000名學術和商業(yè)用戶依賴GATK,進行數百萬次分析。GATK是用于鑒定種系DNA和RNAseq數據中的SNP和插入缺失的行業(yè)標準。除了改善這些已建立的工具的性能外,GATK4還擴展了這一分析范圍,包括種系數和結構變異,用于種系和體細胞研究應用。

        完全開源的軟件

        GATK4將作為一個完全開源的產品發(fā)布,部分歸功于Broad Institute和英特爾公司之間的合作,以推進高性能分析,以便研究人員可以研究來自世界各地不同來源的大量基因組數據。

        在英特爾 - 基因組數據工程中心,軟件工程師和研究人員花了幾個月的時間來構建,優(yōu)化和廣泛共享新的工具和基礎設施,以幫助科學家整合和處理基因組數據。GATK4從這一合作中受益,該合作幫助工程師優(yōu)化了用于基因組分析的硬件和軟件的最佳實踐,從而可以組合和使用駐留在私有云,公共云和混合云上的研究數據集。

        “將GATK4作為開源發(fā)布是我們團隊明顯的下一步,”Broad研究所數據科學與數據工程小組外展與傳播副主任Geraldine Van der Auwera說。“我們相信這是支持社區(qū)的最有效方式,我們希望它能夠繼續(xù)發(fā)展,創(chuàng)新并幫助研究人員獲得對未來人類健康突破至關重要的見解。”“生物醫(yī)學取得進展至關重要,我們用于分析數百萬人基因組的軟件是健全且易于理解的,”EMBL-EBI主任,全球基因組學和健康聯盟(GA4GH)主席Ewan Birney說。 。“使用開源許可證發(fā)布GATK軟件直接支持全球生物醫(yī)學界的開放式創(chuàng)新,數據重用和數據重新分析。“

        “GATK工具對種系和癌癥分析至關重要,”芝加哥大學醫(yī)學系的Robert L. Grossman和生物醫(yī)學信息學專家說。“將GATK4作為一個開源軟件包發(fā)布將提高采用率,并使社區(qū)受益。”

        “開源基因組學和開放式科學一般來說,開源GATK是一件大事,”Chan Zuckerberg Initiative(CZI)計算生物學經理Jeremy Freeman說。“它不僅使這個關鍵工具能夠盡可能廣泛地供受眾使用,重用,檢查和貢獻 - 它為社區(qū)提供了一個強大的示例,說明現有項目如何能夠接受開源。”

        “開源代碼是高效生物醫(yī)學研究的基礎,”哈佛大學陳氏公共衛(wèi)生學院研究科學家布拉德查普曼說。“它通過消除共享和分發(fā)分析的障礙,實現了重復性,重用和重新混合.Broad Institute的GATK團隊領導開發(fā)可擴展,敏感和特定的變體調用算法,開源GATK4將允許Blue Collar Bioinformatics等框架制作這些算法科學研究界廣泛使用的方法。“

        Cloudera的數據科學家,Apache Hadoop PMC的成員湯姆懷特說:“Cloudera一直是開源代碼的支持者和信徒。”“我們很高興為GATK代碼庫做出貢獻,使其在Apache Spark和Cloudera上順利運行.GATK的下一階段,由Spark和開源軟件提供支持,將擴大訪問范圍并改善基因組數據科學家之間的協作。 “

        “GATK4的開源是基因組學的重要一步,可以為研究,生物技術和制藥界公開提供可擴展性和性能提升,”英特爾數據中心解決方案公司副總裁兼總經理Jason Waxman說。“GATK4在英特爾的新參考架構上運行時,與早期版本的軟件相比,可以實現5倍的加速。”

        “我們谷歌很高興看到這個新版本,”Google云端醫(yī)療保健工程負責人Ilia Tulchinsky說。“過去三年來,我們一直在與Broad研究所合作,以加強Google Cloud Platform上的基因組處理。作為開源技術的堅定支持者,我們相信以這種方式提供GATK將有助于各地的基因組科學家使用它。作為英特爾的合作伙伴,我們特別期待讓研究人員使用即將推出的英特爾至強處理器可擴展系列在谷歌云上運行GATK4。

        “GATK是生命科學中使用最廣泛的軟件包之一,我們的團隊與Broad合作非常有效地加速了它在Azure上的使用,”微軟人工智能與研究總監(jiān)Geralyn Miller說。“這個新模型將極大地推動這項工作的進展,我們很高興繼續(xù)并在Azure上圍繞GATK擴展我們的工作。”

        “隨著GATK4的開源推出,有機會創(chuàng)建一個可以協同工作并提升生物信息學藝術水平的全球社區(qū),”阿里巴巴集團云計算部門阿里云的首席架構師洪唐表示。“我們期待與Broad Institute密切合作,將基于云的GATK服務引入中國的基因組學客戶,以及正在進行的GATK研發(fā)。”

        除了提供GATK4作為開源工具包之外,Broad Institute還將繼續(xù)在其廣受歡迎的用戶支持論壇上提供用戶支持,培訓和外展服務。與許多Broad Institute的基因組分析工具一樣,GATK4將通過Broad Institute的基于云的分析平臺FireCloud提供。

        undefined

        鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播更多信息之目的,如有侵權行為,請第一時間聯系我們修改或刪除,多謝。

        推薦內容