国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

AI領域頂會EMNLP 2020落下帷幕

醫健AI掘金志 ? 來源:IoT科技評論 ? 作者:IoT科技評論 ? 2020-12-15 18:12 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

這項工作的意義在于,幫助醫學研究工作者更好地選擇醫學臨床試驗,特別在新冠疫情下,更好的醫學臨床試驗或許就意味著能更快地找到有效的治療方案。 日前,AI領域頂會EMNLP 2020落下帷幕。

今年全球僅有754篇論文被接受,接收率為24%,阿里巴巴憑借28篇論文成為入選論文數最多的中國科技公司。

據雷鋒網《醫健AI掘金志》了解,阿里相關研究成果覆蓋情感分析、文本生成及醫療NLP等領域。

在今年疫情的大環境下,醫療領域的研究與成果產出也不斷提速。

在名為《Predicting Clinical Trial Results by Implicit Evidence Integration》的論文中,達摩院研究團隊設計了針對醫學臨床試驗的進一步預訓練任務,并提出全新的模型,幫助醫學研究工作者更好地選擇醫學臨床試驗,以更快地找到有效的治療方案。

研究團隊在COVID-evidence數據集上完成了試驗,并證明了模型的有效性。

為此,該論文作者、達摩院算法專家譚傳奇進行了解讀。

自18年谷歌BERT橫空出世以來,預訓練語言模型一躍成為自然語言處理領域的研究熱點,“Pre-training + Fine-tune”也成為NLP任務的新范式,將自然語言處理由原來的手工調參、依靠機器學習專家的階段,進入到可以大規模、可復制的大工業施展的階段。

這篇論文在BioBERT(在醫學數據上訓練的BERT模型)的基礎上,設計了針對醫學臨床試驗的進一步預訓練任務(Post-Pre-training),最終在真實醫學臨床試驗數據上微調(Fine-tune)后,取得了超過10個百分點的結果提升。

而這項工作的意義在于,幫助醫學研究工作者更好地選擇醫學臨床試驗,特別在COVID-19疫情下,更好的醫學臨床試驗或許就意味著能更快地找到有效的治療方案。

劍指臨床試驗的設計難題

在循證醫學的時代,任何的治療都要有相應的臨床證據支持。證據往往來自于高質量的臨床試驗。然而,實施臨床試驗耗時耗力,需要大量資源支持。

并且,設計有缺陷或者難以成功的臨床試驗占用了寶貴的病人資源,可能會使亟待實施的臨床試驗因招募不到足夠的患者而被迫終止。

新冠肺炎疫情中的瑞德西韋臨床試驗就是一個例子:

因其他設計有缺陷或者難以成功的臨床試驗占用了不少病人資源,該試驗沒有招募到足夠的病人資源,而沒有得到統計學上顯著的結果。

所以,研究者需要在設計階段就去預測臨床試驗的結果,并優先進行成功概率較高的臨床試驗。

提出新的臨床試驗需要過往臨床證據的支持,比如WHO為新冠肺炎推薦優先檢測氯喹/羥氯喹,瑞德西韋,干擾素和洛匹那韋/利托那韋四種藥物優先進行臨床試驗。

推薦的理由就是,這些藥物在過往的實驗室或人體試驗中對相關冠狀病毒有效。然而,人類綜合過往臨床證據的能力有限。

譚傳奇引用了一個數據:一項研究發現大概86.2%的臨床試驗最終會失敗,WHO專家推薦的某些新冠肺炎治療方法,如氯喹/羥氯喹,也沒有得到好的結果。

臨床試驗設計難題的核心是臨床試驗的結果無法準確預測。

所以,如果能準確地預測臨床試驗的結果,就可以有針對性地進行成功概率的臨床試驗,從而大大提高臨床試驗實施的效率。

因此,譚傳奇團隊表示,在本工作中,我們的貢獻就在于:

第一、創新地從NLP的角度重新定義了臨床試驗結果預測任務;

第二、提出了一種基于大規模隱式臨床證據預訓練的模型EBM-Net(Evidence-Based Medicine Network)用以解決該任務,EBM-Net在各種指標上遠超醫學大規模語言模型BioBERT,如在標準數據集上有10.7%的相對F1提升,并且在新冠肺炎相關的臨床試驗上也被證明有效。

6dfc957e-34d3-11eb-a64d-12bb97331649.png

在上面這張圖中,參考醫學臨床試驗在填報提案時需要的基本信息,輸入是自然文本的形式的:

臨床試驗背景B,如“最新研究發現瑞德西韋在體外對新冠肺炎病毒有效……”;

要研究的人群P,如“重癥新冠肺炎病人”;

治療方法I,如“靜脈注射瑞德西韋”;

對照方法C,如“與瑞德西韋相匹配的安慰劑”;

測量指標O,如“死亡率”

輸出是其結果R,即在研究人群P中,治療組I和對照組C的測量結果O的比較關系,有升高、降低和不變三種。

EBM-Net

717acc3e-34d3-11eb-a64d-12bb97331649.png

為了解決上述臨床試驗結果預測任務,達摩院的團隊提出了針對循證醫學的EBM-Net模型,其結構如圖2所示,具體分為三步進行:

首先,用啟發式方法收集隱式證據;

然后,用隱式證據預訓練比較語言模型;

最后,用預訓練的模型進行臨床試驗結果預測。

收集隱式證據

臨床證據常常以一種比較的形式表達,如“瑞德西韋比對照組有更好的治療新冠肺炎的療效”,而找到這些證據就可以為我們提供訓練文本。

研究團隊發現,PubMed和PubMed Central是一個提供生物醫學方面的論文搜尋以及摘要,文獻資源中就包含需要的證據文本(注:醫學領域最好的大規模語言模型BioBERT的訓練數據即來自PubMed)。

這篇論文提出用關鍵詞匹配的方法,收集PubMed和PubMed Central中所有含有比較語義的句子:

為尋找表達升高和降低的語義,匹配含有“than”的句子,再進一步匹配形容詞或副詞的比較級,如“higher”,“smaller”等,同時含有“than”和一個或更多比較級的句子被收集;為尋找表達相似的語義,匹配含有“no difference between”和“similar to”模式的句子。

這些句子被稱為隱式證據,因為它們往往隱式地含有臨床證據所需要的PICO組分。他們還收集這些句子對應的文章摘要里的背景和方法的部分,作為隱式證據的背景B。

這種方法可以從PubMed和PubMed Central中提取出1180萬條隱式證據,其中240萬條表達結果降低,350萬條表達結果相似,590萬條表達結果升高。

預訓練比較語言模型

將收集到的隱式證據中提示結果語義的詞去除,就構造了一個類似語言模型訓練的問題,通過給定上下文信息,預測去除的比較詞。

論文中改進語言模型,提出用比較語言模型預訓練一個Transformer編碼器模型,即EBM-Net,以獲取預測臨床試驗結果的能力。具體地,兩組樣本被用于預訓練:

1、用正序的隱式證據預測其結果;

2、用反序的隱式證據預測相反的結果。

加入反序的例子有利于模型學到治療組和對照組之間的比較,而不是語言模型里的共現關系。

臨床試驗結果預測

在微調和測試時,團隊將一個新臨床試驗要研究的PICO要素拼接成E,將E和其研究背景B輸入到上述預訓練好的EBM-Net模型中,輸出其預測的比較結果,從而預測臨床試驗的結果。

標準數據集的試驗結果

EBM-Net在臨床試驗結果預測任務的標準數據集Evidence Integration試驗結果如圖3所示:

71e5b760-34d3-11eb-a64d-12bb97331649.png

從結果中可以看出:

1、EBM-Net相比其他方法,包括隨機預測、詞袋+邏輯回歸、利用MeSH知識圖譜、信息檢索+閱讀理解模型以及目前生物醫學NLP領域的SOTA模型BioBERT,都有很大的提高:BioBERT作為最強的基線模型,也比EBM-Net低了10.7%的相對macro-F1和9.6%的準確率;

2、EBM-Net相比其他方法在對抗攻擊下更魯棒:用|Δ||Δ|,即在對抗數據集上的accuracy的相對減少的值來衡量模型的魯棒性,|Δ||Δ|越大表示模型越易受攻擊。

BioBERT的|Δ||Δ|幾乎是EBM-Net的兩倍(5.1%比2.7%),說明EBM-Net遠比BioBERT魯棒;

EBM-Net用于新冠肺炎相關臨床試驗

達摩院團隊還基于COVID-evidence數據庫提取了截止5月12日前完成的22篇臨床試驗的結果,以本工作定義的臨床試驗結果預測的格式構建了一個小型數據集。

達摩院團隊提出的EBM-Net模型在該數據集上進行留一法驗證得到的macro-F1和accuracy都遠高于BioBERT,分別是45.5%比36.1%和59.1%比50.0%,再一次驗證了EBM-Net的有效性。

總結

為了優化臨床試驗的設計過程,本文從NLP的角度定義了臨床試驗結果預測任務,并且提出了一種基于大規模隱式證據預訓練的EBM-Net模型來解決這個任務。

EBM-Net在標準數據集和新冠肺炎相關臨床試驗上都有較好的表現,大幅超過生物醫學NLP的SOTA模型BioBERT。

未來,臨床試驗可以在EBM-Net等相關模型的協助下進行設計:

當我們固定了想要研究的疾病人群(P)和觀察指標(O)后,可以固定以現有的標準治療為對照(C),遍歷每種可能的新型治療方式(I)以及其相關的背景介紹(B),用模型預測其成功的概率,優先選取所有可能的治療方式中成功概率高的做臨床試驗。

當然,模型在技術上還需要進一步地提高才能更好地輔助臨床試驗設計。

后續,我們可以把團隊構建的大規模醫學知識圖譜集成在模型中,使其擁有更準確和魯棒的預測能力。

責任編輯:lq

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    91

    文章

    39793

    瀏覽量

    301428
  • 語言模型
    +關注

    關注

    0

    文章

    571

    瀏覽量

    11314
  • 數據集
    +關注

    關注

    4

    文章

    1236

    瀏覽量

    26196

原文標題:劍指臨床試驗的設計難題!達摩院提出新模型EBM-Net,比最強基線模型準確率高9.6%

文章出處:【微信號:IoT_talk,微信公眾號:醫健AI掘金志】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    后摩智能4篇論文入選人工智能ICLR 2026

    繼斬獲NeurIPS、ICCV、AAAI、ACMMM四大認可后,后摩智能再傳捷報——4篇論文成功入選國際頂級人工智能會議ICLR 2026(International Conference
    的頭像 發表于 02-09 14:18 ?678次閱讀

    理想汽車12篇論文入選全球五大AI

    2025年三季度以來,理想汽車基座模型團隊在國際頂級AI學術會議上取得重大突破,共有12篇高質量研究論文入選AAAI、NeurIPS、EMNLP、ACM MM、ICCV五大
    的頭像 發表于 11-21 14:44 ?756次閱讀
    理想汽車12篇論文入選全球五大<b class='flag-5'>AI</b><b class='flag-5'>頂</b><b class='flag-5'>會</b>

    云知聲論文入選自然語言處理EMNLP 2025

    近日,自然語言處理(NLP)領域國際權威會議 ——2025 年計算語言學與自然語言處理國際會議(EMNLP 2025)公布論文錄用結果,云知聲提交的《面向門診病歷生成的高質量醫患對話合成技術
    的頭像 發表于 11-10 17:30 ?804次閱讀
    云知聲論文入選自然語言處理<b class='flag-5'>頂</b><b class='flag-5'>會</b><b class='flag-5'>EMNLP</b> 2025

    安霸亮相CPSE 2025安博

    為期四天的 “全球安防第一展”——CPSE 2025 安博順利落下帷幕。安霸以“AI 驅動,智影領航”為主題,攜幾大核心技術矩陣亮相安博
    的頭像 發表于 11-04 16:07 ?391次閱讀

    移柯通信亮相第二十屆安博

    2025年10月31日,備受矚目的第二十屆安博圓滿落下帷幕。作為通信技術領域的創新力量,移柯通信在展會上精彩亮相,以"鏈接為基,AI為核"
    的頭像 發表于 11-04 14:21 ?644次閱讀

    北斗智聯亮相2025中國汽車工程學會年會暨展覽

    10月24日,第三十二屆中國汽車工程學會年會暨展覽(SAECCE 2025)在重慶科學會堂圓滿落下帷幕。會議期間,北斗智聯科技有限公司(簡稱“北斗智聯”)戰略發展中心總經理劉蕊磊、副總經理黃勝
    的頭像 發表于 10-28 17:04 ?693次閱讀

    沐曦聯合香港科技大學登上AI

    近日,沐曦PDE-AI Solution團隊與香港科技大學合作,在兩大人工智能頂級會議NeurIPS2025與EMNLP 2025上發表重要研究成果,涵蓋大語言模型(LLM)的多樣化解碼與高效訓練優化方向,展現了中國企業在AI
    的頭像 發表于 10-14 09:46 ?1474次閱讀

    升譜光電亮相2025中國光博

    9月12日,為期3日的第26屆中國國際光電博覽(CIOE中國光博)完美落下帷幕
    的頭像 發表于 09-16 11:16 ?917次閱讀
    升譜光電亮相2025中國光博<b class='flag-5'>會</b>

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+可期之變:從AI硬件到AI濕件

    生物化學計算機,它通過離子、分子間的相互作用來進行復雜的并行計算。因而未來可期的前景是AI硬件將走向AI濕件。 根據研究,估算出大腦的功率是20W,在進行智力活動時,其功率增大到25~50W。在大腦進化
    發表于 09-06 19:12

    輕量化AI+AR顯示設備的新變局拉開帷幕

    在智能穿戴設備行業的激烈競爭中,每一次產品的推出與戰略的調整都如同投入湖面的巨石,激起層層漣漪。蘋果公司,這位科技領域的巨頭,其一舉一動都備受全球矚目。近期,蘋果公司在AI+AR顯示設備領域的發展態勢發生了微妙的變化,一場關于輕
    的頭像 發表于 08-19 11:19 ?1118次閱讀

    小鵬汽車在全球AI會展示下一代自動駕駛模型

    此前,北京時間6月11-14日,計算機視覺CVPR 2025在美國田納西州納什維爾舉行,小鵬汽車受邀參與自動駕駛研討CVPR WAD(Workshop on Autonomous
    的頭像 發表于 06-23 09:13 ?1156次閱讀

    湖北移動攜手華為打造AI WAN SPN智慧教育專網

    2025年全國高考正式落下帷幕,湖北移動聯合華為等合作伙伴依托AI WAN SPN(Slicing Packet Network,切片分組網)打造智慧教育專網,以“云網智能一體化”為特征的SPN教育專網,為湖北高考提供
    的頭像 發表于 06-14 11:02 ?1122次閱讀

    酷芯微電子亮相2025深圳國際無人機展覽

    近日,2025國際低空經濟與無人系統博覽暨第十屆深圳國際無人機展覽圓滿落下帷幕。作為無人機領域的年度盛會,本次展會匯聚產業鏈上下游,聚焦
    的頭像 發表于 05-30 16:00 ?1169次閱讀

    后摩智能四篇論文入選三大國際

    2025 年上半年,繼年初被 AAAI、ICLR、DAC 三大國際會收錄 5 篇論文后,后摩智能近期又有 4 篇論文入選CVPR、ICML、ACL三大國際,面向大模型的編碼、量化、壓縮與微調等技術難題提出創新性解決方案,為
    的頭像 發表于 05-29 15:37 ?1337次閱讀

    華太電子亮相第十三屆儲能國際峰會暨展覽

    此前,2025年4月12日,第十三屆儲能國際峰會暨展覽(ESIE 2025)在北京落下帷幕。作為儲能技術創新的重要參與者,蘇州華太電子技術股份有限公司攜重磅系統級產品亮相A3館A339展位,以“芯片-模組-系統”三級驗證體系全
    的頭像 發表于 04-14 17:13 ?1515次閱讀