序禎達生物是中國領先的多組學和測序服務提供商之一,該公司利用 NVIDIA Parabricks 來加速多組學分析。借助 Parabricks,序禎達生物將全基因組測序的時間從 7 小時縮短至 31 分 05 秒,幾乎是使用 CPU 加速的 14 倍。序禎達生物還通過 Parabricks BWA-Meth 實現了比對的顯著提速,與傳統比對方法相比,將甲基化比對的速度提升了 21 倍。
序禎達生物將前沿的多組學技術引入中國市場,為廣泛的商業用戶群體提供服務,是中國領先的多組學服務提供商之一。公司提供下一代測序(NGS)和多組學服務,其分布式測序實驗室每月產生超過 1.5 PB 的數據,為下游分析提供了大量有價值的數據。
序禎達生物處于測序技術的前沿,支持基因組學、轉錄組學、蛋白質組學、微生物組學和多組學研究,通過精準測序和多組學解決方案為生命科學領域帶來革新。
作為中國首家使用 NVIDIA GPU 加速片段分析的 NGS 公司,序禎達生物是該領域公認的領導者和創新者,其旗下設有兩大主要業務部門:
FLASH-SEQ:一個覆蓋中國多個城市的 NGS 測序平臺。序禎達生物擁有 10 個實驗室,是中國最大的 NGS 測序服務供應商之一。
序禎達多組學:中國最大的多組學供應商之一,專注為制藥公司的臨床和研究階段提供服務。自 2021 年以來,序禎達生物已在中國開展了 300 多個隊列研究。
序禎達生物聯合創始人兼首席信息官費家俊表示:“我們為客戶提供從濕實驗室到干實驗室的整體解決方案。我們看到了 GPU 在加速生命科學發現方面的巨大潛力,正在開展多項業內革命性工作,以實現我們下一代基因測序生產力的數字化。”
借助 NVIDIA 的技術加速分析
作為中國最大的測序中心之一,序禎達生物的測序儀會產生海量數據。因此,序禎達生物需要一個能夠處理大規模數據集并簡化分析的解決方案。該團隊采用了 NVIDIA Parabricks,這是一個用于二級分析的可擴展基因組學軟件套件,提供經 GPU 加速的可信開源工具版本。
費家俊回憶道:“2021 年,我們引入了 NVIDIA Parabricks 和 GPU,利用這些技術加速多組學分析工作負載。此次合作旨在借助 Parabricks 平臺來加速多組學分析。我們看到了 AI 在助力科學研究以及加快研究進程、為客戶提供更多支持方面的巨大潛力。”
Parabricks 將基因組處理速度提升“百倍”
序禎達生物使用 Parabricks 來加速WES(外顯子組測序)和WGS(全基因組測序)。此前,該公司在使用基因組分析工具包(GATK)和 CPU 時遭遇了顯著的延遲問題。使用 GATK 時,WES需要 15 個小時完成,WGS則需要 50 個小時。使用 CPU 加速后,WES時間降至 2 個小時,WGS時間降至 7 個小時。
但將 Parabricks 應用于這兩種類型的檢測后,速度得到了顯著提升。借助 Parabricks,WES僅需 2 分 37 秒,速度幾乎是 CPU 加速方法的 46 倍,是 GATK 的近 344 倍。WGS僅需 31 分 05 秒,速度幾乎是 CPU 加速的 14 倍,是 GATK 的近 97 倍。
這種加速直接影響患者治療效果,因為數據分析以往通常是瓶頸所在。序禎達生物信息技術總監王佳偉解釋說:“使用 GATK 工作負載時,從WGS數據中獲取單個樣本結果需要花費 30-50 個小時。而使用 Parabricks 之后,我們可以將時間縮短至不到 1 小時。”
數據和基準測試由序禎達生物提供Parabricks 將甲基化比對加速 21 倍
Parabricks 的結果不僅與開源工具一致(這保障了研究的可重復性和透明度),還能顯著加速一直以來耗時的分析步驟。除了加速全外顯子組測序和全基因組測序之外,序禎達生物還希望改進甲基化比對。
對于經亞硫酸氫鹽處理的 DNA 測序讀數(BS-Seq)的比對,則使用了 BWA-Meth 來檢測 DNA 甲基化。在一個 110GB 的數據集上,使用傳統方法完成比對需要 21 個小時。而使用 8 塊 NVIDIA T4 GPU 以及 Parabricks 中經 GPU 加速的 BWA-Meth 版本,比對時間縮短至僅 1 個小時。與傳統方法相比,使用 Parabricks 進行甲基化比對的速度提升了 21 倍。
數據和基準測試由序禎達生物提供NVIDIA CUDA-X 數據科學庫將單細胞分析提升至 “秒級”
序禎達生物支持多種應用場景的工作負載,包括單細胞分析。然而,單細胞數據處理可能極其耗時,尤其是在數據集規模不斷擴大的情況下。
NVIDIA CUDA-X Data Science(RAPIDS)是一套開源的 GPU 加速的數據科學和 AI 庫,可提升整個數據工作流的性能。CUDA-X DS 常用于基因組學應用中的單細胞分析和三級分析。序禎達生物發現,在一個包含 70,000 個人類肺細胞的數據集上,與 Scanpy 相比,使用 CUDA-X DS 可以顯著加速預處理步驟。使用 Scanpy 時,預處理需要 37 分鐘完成,而使用 CUDA-X DS 時,該步驟僅需約 22 秒,速度提升了近 101 倍。
數據和基準測試由序禎達生物提供賦能一整套解決方案
從加速甲基化比對到縮短單細胞分析的預處理時間,序禎達生物借助了多種 NVIDIA 技術來減少運行時間。通過利用 NVIDIA 的硬件和軟件(包括 T4 GPU、Parabricks 和 CUDA-X DS),序禎達生物加速了一直以來耗時的流程。因此,NVIDIA 提供的完整解決方案使序禎達生物能夠應對各種不同的應用場景,并為客戶帶來即時價值。
-
NVIDIA
+關注
關注
14文章
5592瀏覽量
109715 -
gpu
+關注
關注
28文章
5194瀏覽量
135427
原文標題:序禎達生物借助 NVIDIA Parabricks 將甲基化比對速度提升 21 倍
文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達企業解決方案】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
利用NVIDIA Cosmos開放世界基礎模型加速物理AI開發
NVIDIA推出面向語言、機器人和生物學的全新開源AI技術
利用 Banana Pi BPI-CM5 Pro(ARMSoM CM5 SoM) 加速保護科學
NVIDIA 利用全新開源模型與仿真庫加速機器人研發進程
燧弘華創與泰達生物簽署AI醫療健康領域戰略合作協議
NVIDIA RTX AI加速FLUX.1 Kontext現已開放下載
達實智能攜手信達生物打造智慧園區新標桿
NVIDIA全棧加速代理式AI應用落地
全球各大品牌利用NVIDIA AI技術提升運營效率
NVIDIA攜手微軟加速代理式AI發展
借助NVIDIA技術加速半導體芯片制造
NVIDIA加速的Apache Spark助力企業節省大量成本
Oracle 與 NVIDIA 合作助力企業加速代理式 AI 推理
序禎達生物利用NVIDIA Parabricks技術加速多組學分析
評論