国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

應用深度學習分析提高基因組分析的準確性

Tensorflowers ? 來源:TensorFlow ? 作者:Howard Yang ? 2021-05-14 09:49 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

發布人:Google Health Genomics 產品負責人 Andrew Carroll 和 Genomics 項目經理 Howard Yang

Google Health 的 Genomics 團隊很高興分享我們對 DeepVariant 的最新擴展 - DeepTrio。

DeepVariant 于 2017 年首次發布,是一種開源工具,支持研究人員和臨床醫生分析個人的基因組測序數據并識別基因變異,如可導致疾病的變異片段。我們在 DeepVariant 方面的持續研究因其一流的準確性而獲得肯定。借助 DeepTrio,我們擴展了 DeepVariant,從而能夠在分析母親-父親-子女三人的基因序列數據時考量基因變異。

人類是二倍體生物,攜帶人類基因組的兩個副本。每個個體都分別繼承了來自母親和父親的一個基因組副本。父母遺傳信息有助于分析符合孟德爾遺傳規律的特征和疾病。DeepTrio 學習直接在測序數據中使用孟德爾遺傳的特性,以便在可以共同分析父母和子女樣本的情況下更準確地識別基因變異。

修改 DeepVariant 以分析三人樣本

DeepVariant 學習到如何將基因組中的位置分類為參考或者“基因組瀏覽器”(相關專家用于分析的工具)中數據表示的變種?!啊妒褂?DeepVariant1.0 提高基因組分析的準確性》(Improving the Accuracy of Genomic Analysis with DeepVariant 1.0)”一文很好地概述了有關內容。

使用 DeepVariant1.0 提高基因組分析的準確性

https://ai.googleblog.com/2020/09/improving-accuracy-of-genomic-analysis.html

DeepVariant 接收數據作為以候選變異為中心的基因組窗口,并且按照要求將數據分類為參考(無變異)、雜合子(變異的一個副本)或純合子(兩個副本均為變異)。DeepVariant 將序列證據視為代表數據特征的通道(請參閱“《透過 DeepVariant 深入觀察》(Looking through DeepVariant’s eyes)”獲取更深入解釋)。

透過 DeepVariant 深入觀察

我們修改了 DeepTrio,以在單個圖像中表示來自三人的序列數據,其中每個樣本的高度固定,子女的數據置于中間。我們使用來自美國國家標準與技術研究院 (NIST) 瓶中基因組聯盟 (GIAB) 的黃金標準樣本作為真實標簽,訓練一個模型調用子女樣本中的變異,并訓練另一個模型調用頂部父母樣本中的變異。為調用父母雙方的樣本,我們翻轉父母樣本的位置。

衡量 DeepTrio 提高的準確性

我們研究發現,對于父母和子女變異檢測,DeepTrio 比 DeepVariant 更準確,在覆蓋率較低的情況下具有特別明顯的優勢。這使研究人員能夠以更高的準確性分析樣本,或者在顯著降低費用的同時保持相當的準確性。

為評估 DeepTrio 的準確性,我們借助 NIST 瓶中基因組聯盟提供的涵蓋廣泛特征的黃金標準,將其與 DeepVariant 的準確性進行比較。為獲得在訓練中從未見過的評估數據集,我們在訓練中排除了 20 號染色體,并對 20 號染色體進行了評估。

我們訓練 DeepVariant 和 DeepTrio,以對來自兩種不同儀器 Illumina 和 Pacific Biosciences (PacBio) 的數據進行測序。如要詳細了解這些技術之間的差異,請參見我們之前的博客。這些測序儀均以容易錯誤的方式隨機采樣基因組。為準確分析基因組,我們需要重復采樣相同區域。在某個位置的采樣深度稱為覆蓋范圍。以近似線性的方式測序來覆蓋更大的范圍將導致成本更高。因此我們經常需要在成本、準確性和測序樣本之間進行權衡。而權衡的結果是,在三人樣本中,父母樣本通常以較低的深度進行測序。

在下方圖表中,我們繪制了一系列不同覆蓋范圍中 DeepTrio 和 DeepVariant 的準確性。

00077b0a-b42c-11eb-bf61-12bb97331649.png

001e90f6-b42c-11eb-bf61-12bb97331649.png

圖 2.子女樣本(頂部)和父母樣本(底部)上 DeepTrio(實線)和 DeepVariant(虛線)的 F1 得分,使用 Illumina(藍色)和 PacBio(黑色)儀器進行測序。在具有一系列測序覆蓋范圍(x 軸)的樣本中,對 20 號染色體上所有類型的小變異進行 F1 測量

DeepTrio 在 de novo 變異上的表現

相對于人類參考基因組,每個人大約有 500 萬處變異,其中絕大多數從父母處繼承而來。一小部分(大約 100 處)是新變異(稱為 de novo),由 DNA 復制過程中的復制錯誤導致。我們的研究證明,DeepTrio 大大減少了 de novo 變異檢測的假陽性情況。對于 Illumina 數據,其真陽性回收率的下降幅度較小,而對于 PacBio 數據,這種權衡不會發生。

為評估準確性,我們分析了父母兩人都被稱為非變異但子女被稱為雜合變異的位點。我們觀察到 DeepTrio 更不愿意將變異命名為 de novo,這類似于人類對于違反孟德爾遺傳規律的位點,需要獲得更高水平的證據。因此,此類 de novo 變異的假陽性率低得多,但 DeepTrio Illumina 的召回率則略低。通常,在發生這種情況時,子女的樣本仍將稱作變異,但父母樣本則給予“不調用”的判斷(分類器沒有足夠的信心進行調用)。

促進罕見病研究

通過將 DeepTrio 作為開源軟件發布,我們希望這一軟件能夠支持科學家更準確地分析樣本,進而提升對基因組數據的分析能力。我們希望這能促進研究和臨床開發,進而更好地解析罕見病病例,并改進治療方法的開發。

除了將 DeepTrio 的代碼作為開放源代碼發布之外,我們還發布了為訓練這些模型而生成的測序數據。這些數據會在預印本“《用于基準測試和開發的黃金標準樣本的廣泛序列數據集》(An Extensive Sequence Dataset of Gold-Standard Samples for Benchmarking and Development)”中加以說明。通過發布該生產模型和訓練相似復雜度模型所需的數據,我們希望能為基因組學界的方法開發做出貢獻。

原文標題:應用深度學習分析家庭基因組數據

文章出處:【微信公眾號:TensorFlow】歡迎添加關注!文章轉載請注明出處。

責任編輯:haq

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 開源
    +關注

    關注

    3

    文章

    4203

    瀏覽量

    46129
  • 深度學習
    +關注

    關注

    73

    文章

    5598

    瀏覽量

    124396

原文標題:應用深度學習分析家庭基因組數據

文章出處:【微信號:tensorflowers,微信公眾號:Tensorflowers】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    如何優化是德頻譜分析儀N9950A幅度測量的準確性

    是德科技(Keysight)N9950A作為高性能頻譜分析儀,廣泛應用于射頻與微波信號的精密測量。在實際使用中,為確保幅度測量結果的準確性,需從校準流程、環境控制、參數設置及連接優化四個維度系統性
    的頭像 發表于 12-17 16:02 ?137次閱讀
    如何優化是德頻譜<b class='flag-5'>分析</b>儀N9950A幅度測量的<b class='flag-5'>準確性</b>

    電能質量在線監測裝置生成的月度分析報告的準確性如何保證?

    電能質量在線監測裝置生成的月度分析報告準確性,需通過“源頭數據精準→過程處理合規→輸出配置規范→校驗審核閉環→運維長效保障”全流程管控實現,核心圍繞 “數據可追溯、算法可驗證、結果可復核” 三大目標
    的頭像 發表于 12-10 17:00 ?1204次閱讀
    電能質量在線監測裝置生成的月度<b class='flag-5'>分析</b>報告的<b class='flag-5'>準確性</b>如何保證?

    確保X光設備檢測的有效準確性的關鍵技巧

    在工業和安全領域,X光設備檢測已成為不可或缺的重要環節。然而,許多用戶常常面臨檢測效果不理想、準確性不足的問題,影響生產效率和安全保障。如何確保X光檢測設備能夠發揮最大效能,準確捕捉目標信息,是當前
    的頭像 發表于 11-18 11:27 ?395次閱讀

    電能質量在線監測裝置的數據推送頻率調整會影響數據的準確性嗎?

    電能質量在線監測裝置的數據推送頻率調整對數據準確性的影響需從 采樣、處理、傳輸 三個核心環節綜合評估,其關鍵取決于 調整策略與裝置設計的匹配度 。以下是基于技術原理與工程實踐的詳細分析: 一、核心
    的頭像 發表于 11-07 11:08 ?648次閱讀

    電能質量在線監測裝置的精度等級對其測量結果的準確性有何影響?

    電能質量在線監測裝置的精度等級是衡量其測量結果準確性的 核心量化指標 ,直接決定了測量值與 “真實值” 的偏差范圍。精度等級越高(如 A 級),誤差限值越嚴格,測量結果的準確性越高;反之(如 B/C
    的頭像 發表于 09-26 17:40 ?1318次閱讀

    電能質量在線監測裝置定位諧波源的準確性有多高?

    電能質量在線監測裝置定位諧波源的準確性 沒有固定數值 ,而是受 “ 監測網絡設計、技術參數精度、算法適配、電網工況復雜 ” 四大核心因素影響,呈現 “ 場景化差異 ”—— 在理想條件下(如低壓配
    的頭像 發表于 09-26 15:20 ?592次閱讀

    電能質量監測中,數據校驗系統的準確性如何影響暫態過電壓指標?

    ,進而影響暫態過電壓監測的 “故障識別、風險評估、溯源分析” 三大核心功能。具體影響可從暫態過電壓的關鍵監測參數、實際應用場景兩個維度展開: 一、直接影響暫態過電壓的核心監測參數準確性 暫態過電壓的 “危害程度” 和
    的頭像 發表于 09-25 17:57 ?688次閱讀

    如何保障電能質量監測裝置的準確性?

    保障電能質量監測裝置(以下簡稱 “裝置”)的準確性,需貫穿其 “ 選型→安裝→運行維護→校準→報廢 ” 全生命周期,核心是通過 “ 源頭把控硬件精度、過程規避干擾與退化、定期驗證與修正 ”,確保裝置
    的頭像 發表于 09-23 16:03 ?899次閱讀

    如何保證數據校驗系統的時間同步以提高準確性?

    在電能質量監測的數據校驗系統中, 時間同步的準確性直接決定了多監測點數據的時空一致、暫態事件的時序匹配度,以及校驗結果的可信度 。要保證時間同步以提升數據校驗準確性,需從 “協議選擇、硬件保障
    的頭像 發表于 09-19 11:28 ?645次閱讀

    如何使用運行數據趨勢分析驗證裝置準確性?

    利用運行數據趨勢分析驗證電能質量在線監測裝置準確性,核心邏輯是 通過長期采集的電網運行數據,判斷其趨勢是否符合電網實際規律、是否具備穩定性與一致 —— 若裝置準確,其輸出的數據趨勢應
    的頭像 發表于 09-18 10:33 ?490次閱讀
    如何使用運行數據趨勢<b class='flag-5'>分析</b>驗證裝置<b class='flag-5'>準確性</b>?

    測縫計測量數據的準確性和校準方法解析

    在結構物安全監測領域,數據準確性是評估工程健康狀態的核心依據。振弦式測縫計作為主流裂縫監測設備,其測量精度直接影響裂縫發展趨勢的判斷。那么如何確保測縫計測量數據的準確性以及如何校準?下面是南京峟思給
    的頭像 發表于 07-07 13:56 ?664次閱讀
    測縫計測量數據的<b class='flag-5'>準確性</b>和校準方法解析

    必知!影響手機氣密檢測準確性的重要因素

    移動設備防水防塵技術升級,手機氣密檢測成保障產品可靠的關鍵。但檢測準確性受設備精度、環境穩定性、操作規范性及手機結構設計局限等因素干擾,影響測試結果、產品良品率和用戶體驗。影響手機氣密
    的頭像 發表于 07-04 14:26 ?898次閱讀
    必知!影響手機氣密<b class='flag-5'>性</b>檢測<b class='flag-5'>準確性</b>的重要因素

    中科曙光構建全國產化基因組學高性能計算平臺

    近日,中科曙光承建的國內某研究所基因組學高性能計算平臺正式交付。這是國內生物信息學領域首個從底層硬件到上層軟件實現完全自主可控,并深度融合高性能計算與人工智能算力的平臺,成功填補了該領域國產高端算力的空白。
    的頭像 發表于 06-26 17:36 ?1010次閱讀

    存儲示波器的存儲深度對信號分析有什么影響?

    。以下從技術原理、實際影響及優化策略三方面展開分析。一、存儲深度對信號分析的核心影響1. 時域信號完整 邊沿細節捕捉能力 高頻信號邊沿:如100MHz時鐘信號的上升沿/下降沿時間通
    發表于 05-27 14:39

    如何使用POT準確性檢查器?

    :95:0.00% 分辨率視覺對象等級挑戰 (VOC) 數據集未經英特爾驗證。如 Yolo-v4-tf 文檔 中所提到,英特爾已使用上下文中常見的對象 (COCO) 數據集驗證了準確性。通過
    發表于 03-06 08:04