国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

近五年來中文電子病歷的命名實(shí)體識別研究進(jìn)展

深度學(xué)習(xí)自然語言處理 ? 來源:python遇見NLP ? 2020-08-27 17:56 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

閱讀綜述性論文是一種能夠快速了解某一領(lǐng)域的方法,接下來通過今年的一篇綜述性論文來了解一下近五年來中文電子病歷的命名實(shí)體識別研究進(jìn)展。

基本的,我們應(yīng)該先來了解一下兩個概念:電子病歷和命名實(shí)體識別。

電子病歷(Electronic Medical Record,EMR)是指醫(yī)務(wù)人員在醫(yī)療活動過程中,使用醫(yī)療機(jī)構(gòu)信息系統(tǒng)生成的數(shù)字化信息, 并能實(shí)現(xiàn)存儲、管理、傳輸和重現(xiàn)的醫(yī)療記錄。電子病歷中的文本內(nèi)容是醫(yī)務(wù)人員按照《病歷書寫基本規(guī)范》和《電子病歷基本規(guī)范(試行)》中相關(guān)書寫規(guī)定,圍繞患者醫(yī)療需求與服務(wù)活動而記錄的描述性文本內(nèi)容。

命名實(shí)體識別(Named Entity Recognition,NER)是指識別自由文本中具有特定意義的實(shí)體,如人名、地名、專有名詞等。與通用領(lǐng)域的命名實(shí)體不同,電子病歷中的命名實(shí)體通常有疾病、癥狀、治療等實(shí)體。

有了上述兩個概念的了解后,接下來我們就可以來了解中文電子病歷命名實(shí)體識別的任務(wù),它包括:

①電子病歷數(shù)據(jù)的獲取與匿名化處理;

②明確命名實(shí)體種類,進(jìn)行語料標(biāo)注;

③構(gòu)建模型進(jìn)行實(shí)體識別;

④結(jié)果評價及優(yōu)化。

以電子病歷中現(xiàn)病史章節(jié)為例,中文電子病歷命名實(shí)體識別研究任務(wù)流程如圖1所示:

從上述四個任務(wù)出發(fā),我們繼續(xù)進(jìn)行探討。

1

電子病歷數(shù)據(jù)集的獲取

中文電子病歷數(shù)據(jù)的獲取途徑通常包括:

①與醫(yī)院建立合作關(guān)系,如曲春燕等通過與某醫(yī)科大學(xué)附屬醫(yī)院建立合作關(guān)系獲取到該院35個大科室、87個小科室的992份電子病歷。同時,相關(guān)醫(yī)務(wù)人員也全程參與數(shù)據(jù)標(biāo)注,為數(shù)據(jù)集的質(zhì)量提供了保障。

②開放獲取的學(xué)術(shù)評測語料,如CCKS2020學(xué)術(shù)評測任務(wù)三開放了用于命名實(shí)體識別評測任務(wù)的已標(biāo)注匿名化電子病歷1500份和未標(biāo)注的電子病歷1000份,在電子病歷語料資源匱乏的現(xiàn)狀下,全國知識圖譜與語義計(jì)算大 會無疑為行業(yè)發(fā)展作出了巨大貢獻(xiàn)。 ③網(wǎng)絡(luò)發(fā)布的電子病歷資源。 當(dāng)前,大多數(shù)研究采用第1種方式獲取電子病歷的研究數(shù)據(jù),并邀請醫(yī)務(wù)人員參與語料數(shù)據(jù)的標(biāo)注工作;而第2、3種獲取方式具有很大的不確定性,并且電子病歷的數(shù)據(jù)標(biāo)注工作過程控制和質(zhì)量控制均存在不確定性。

2

數(shù)據(jù)標(biāo)注的相關(guān)工作

曲春燕等參照i2b2 2010的標(biāo)注規(guī)范制定了中文電子病歷的標(biāo)注規(guī)范,進(jìn)而在兩名臨床醫(yī)生的全程參與下,對病歷文本分為前后共計(jì)4輪標(biāo)注,并進(jìn)行了一致性檢驗(yàn)。楊錦鋒等在曲春燕等人的工作基礎(chǔ)上,對相同的病歷文本資源,進(jìn)行了命名實(shí)體和實(shí)體關(guān)系的標(biāo)注語料構(gòu)建工作。He等在曲春燕、楊錦鋒等人的工作基礎(chǔ)上,新增了電子病歷文本的分詞、詞性標(biāo)注、斷言、關(guān)系抽取等自然語言處理常見任務(wù)的語料標(biāo)注工作,并對標(biāo)注結(jié)果進(jìn)行了一致性檢驗(yàn)。 上述學(xué)者的延續(xù)性標(biāo)注工作,對今后研究的語料標(biāo)注工作具有一定的指導(dǎo)意義。然而,與臨床醫(yī)生長期從事語料建設(shè)和維護(hù)的難以實(shí)現(xiàn)。一方面,臨床醫(yī)生用于語料標(biāo)注的時間有限;另一方面,邀請臨床醫(yī)生標(biāo)注語料成本更高。因此,醫(yī)學(xué)數(shù)據(jù)標(biāo)注團(tuán)隊(duì)建設(shè)和專業(yè)人員培養(yǎng)的可行性值得探討。

3

主要的命名實(shí)體識別算法模型

中文命名實(shí)體識別的主要研究算法為條件隨機(jī)場(CRF)和雙向長短期記憶網(wǎng)絡(luò)模型條件隨機(jī)場(Bi-LSTM-CRF)。 Liu等設(shè)計(jì)不同特征模板和上下文窗口進(jìn)行條件隨機(jī)場的學(xué)習(xí)訓(xùn)練,進(jìn)行模型實(shí)體識別效率的比對分析,以尋找最佳的電子病歷特征模板和上下文窗口。Liu等在i2b2 2010,2012和2014語料上實(shí)驗(yàn)對比了Bi-LSTM-CRF與傳統(tǒng)的CRF實(shí)體識別算法的性能,結(jié)果表明Bi-LSTM-CRF性能較好。CCKS 2017學(xué)術(shù)評測任務(wù)二:面向電子病歷的命名實(shí)體識別,共收錄了7篇論文,研究內(nèi)容和測評結(jié)果等見表1??傮w上看,7篇論文均有對Bi-LSTM-CRF(或Bi-LSTM)算法模型的實(shí)現(xiàn);均采用“字粒度”模型使用word2vec工具將輸入文本特征向量化表示。Zhang等利用CCKS 2017開放的電子病歷語料,分別采用CRFs和Bi-LSTM-CRF兩種統(tǒng)計(jì)機(jī)器學(xué)習(xí)算法從電子病歷數(shù)據(jù)集中識別疾病、身體部位和治療等信息,并對兩種方法進(jìn)行了對比分析,發(fā)現(xiàn)后者性能較好。Qiu等為提高循環(huán)神經(jīng)網(wǎng)絡(luò)模型的訓(xùn)練速度,提出了殘差卷積神經(jīng)網(wǎng)絡(luò)條件隨機(jī)場模型(RD-CNN-CRF)在CCKS 2017開放測試語料上獲得了較Bi-LSTM-CRF更高的訓(xùn)練速度和F1值。CCKS 2018學(xué)術(shù)評測任務(wù)一:面向中文電子病歷的命名實(shí)體識別,共收錄論文2篇,分別是Yang等將詞嵌套、詞性、偏旁部首、拼音、詞典和規(guī)則特征作為條件隨機(jī)場(CRFs)的學(xué)習(xí)特征,實(shí)驗(yàn)F1值為89.26%;Luo等基于多特征(如標(biāo)點(diǎn)符號、分詞和詞典等特征)融合,整合CNN-CRF, Bi-LSTM-CRF, Bi-LSTM-CNN-CRF, Bi-LSTM+CNN-CRF和Lattice LSTM五種神經(jīng)網(wǎng)絡(luò)模型,實(shí)驗(yàn)F1值最高達(dá)到了88.63%(表1)。

4

結(jié)果評價及優(yōu)化

隨著中文電子病歷命名實(shí)體識別的研究逐步深入以及相關(guān)算法框架的逐漸成熟,基于中文電子病歷的命名實(shí)體識別算法構(gòu)成了臨床電子病歷系統(tǒng)、專病科研數(shù)據(jù)提取、臨床輔助決策系統(tǒng)的重要組成部分。 電子病歷命名實(shí)體識別結(jié)果評價指標(biāo)說明如下圖:

袁冬生為解決出院小結(jié)文檔中普遍存在的信息不準(zhǔn)確、無效信息、信息缺失等問題,設(shè)計(jì)開發(fā)了一套基于命名實(shí)體識別的出院小結(jié)錯誤檢測系統(tǒng)。李山為提高住院病歷錄入的交互性和可操作性,降低書寫的繁雜度,減輕醫(yī)生負(fù)荷,提高工作效率,使用條件隨機(jī)場算法,進(jìn)行電子病歷命名實(shí)體識別,提取病歷中重要的診療信息,并將其應(yīng)用在住院病歷錄入輔助中,以優(yōu)化和改善病歷錄入方式。Su等則基于中文電子病歷命名實(shí)體標(biāo)注規(guī)范構(gòu)建了一個可用于識別心血管疾病危險因素的語料庫。

展望

.....

針對電子病歷的語義特征的量化分析與研究,對于提升算法特征工程質(zhì)量有積極意義;近兩年來,針對電子病歷語料標(biāo)注的成本問題,很多研究聚焦于半監(jiān)督和無監(jiān)督的算法來實(shí)現(xiàn)基于少量標(biāo)注語料或完全基于非標(biāo)注原始語料進(jìn)行實(shí)體識別,是一個重要的研究方向。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 電子病歷
    +關(guān)注

    關(guān)注

    1

    文章

    61

    瀏覽量

    20567
  • 數(shù)字化
    +關(guān)注

    關(guān)注

    8

    文章

    10663

    瀏覽量

    67233
  • 識別
    +關(guān)注

    關(guān)注

    3

    文章

    175

    瀏覽量

    32594

原文標(biāo)題:【NER綜述】近五年中文電子病歷命名實(shí)體識別研究進(jìn)展

文章出處:【微信號:zenRRan,微信公眾號:深度學(xué)習(xí)自然語言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    20年來最大突破!中國科研團(tuán)隊(duì)攻克芯片散熱難題

    電子發(fā)燒友網(wǎng)報道(文/李彎彎)當(dāng)今科技飛速發(fā)展,芯片作為電子設(shè)備核心部件,性能提升推動各領(lǐng)域進(jìn)步,但散熱問題長期制約其性能突破。隨著人工智能大模型和高性能計(jì)算爆發(fā)式增長,芯片功耗和發(fā)熱密度指數(shù)級上升
    的頭像 發(fā)表于 01-16 08:06 ?4642次閱讀
    <b class='flag-5'>近</b>20<b class='flag-5'>年來</b>最大突破!中國科研團(tuán)隊(duì)攻克芯片散熱難題

    東南大學(xué)團(tuán)隊(duì)多能X射線智能成像研究獲重要進(jìn)展

    圖.(A)多能X射線成像及智能物質(zhì)識別系統(tǒng)的工作原理圖;(B)該系統(tǒng)對雞爪的成像與生物組織識別結(jié)果。 近日,東南大學(xué)多維探測與智能識別團(tuán)隊(duì)在多能X射線成像與物質(zhì)智能識別方向
    的頭像 發(fā)表于 02-05 09:14 ?40次閱讀
    東南大學(xué)團(tuán)隊(duì)多能X射線智能成像<b class='flag-5'>研究</b>獲重要<b class='flag-5'>進(jìn)展</b>

    應(yīng)用多光譜數(shù)字圖像區(qū)分苗期作物與雜草的研究進(jìn)展

    在現(xiàn)代農(nóng)業(yè)中,苗期作物與雜草的精準(zhǔn)識別是實(shí)現(xiàn)精準(zhǔn)農(nóng)業(yè)和可持續(xù)發(fā)展的關(guān)鍵環(huán)節(jié)。傳統(tǒng)的人工識別方法效率低、成本高且易受主觀因素影響,而多光譜數(shù)字圖像技術(shù)通過捕捉作物與雜草在不同波段下的光譜特征,結(jié)合圖像
    的頭像 發(fā)表于 10-21 15:25 ?360次閱讀

    多光譜圖像顏色特征用于茶葉分類的研究進(jìn)展

    多光譜成像技術(shù)結(jié)合顏色特征分析為茶葉分類提供了高效、非破壞性的解決方案。本文系統(tǒng)綜述了該技術(shù)的原理、方法、應(yīng)用案例及挑戰(zhàn),探討了其在茶葉品質(zhì)分級、品種識別和產(chǎn)地溯源中的研究進(jìn)展,并展望了未來發(fā)展方向
    的頭像 發(fā)表于 10-17 17:09 ?587次閱讀
    多光譜圖像顏色特征用于茶葉分類的<b class='flag-5'>研究進(jìn)展</b>

    高光譜成像在作物長勢監(jiān)測和產(chǎn)量預(yù)估的研究進(jìn)展

    參數(shù)的非接觸式、高精度監(jiān)測。近年來,隨著遙感技術(shù)和人工智能算法的發(fā)展,高光譜成像系統(tǒng) (SKY機(jī)載高光譜相機(jī)+中達(dá)瑞和 云平臺) 已成為作物長勢監(jiān)測和產(chǎn)量預(yù)估的重要工具。本文系統(tǒng)梳理該技術(shù)的原理、應(yīng)用進(jìn)展,為相關(guān)研究提供參考。
    的頭像 發(fā)表于 10-16 16:31 ?534次閱讀
    高光譜成像在作物長勢監(jiān)測和產(chǎn)量預(yù)估的<b class='flag-5'>研究進(jìn)展</b>

    高光譜成像在作物病蟲害監(jiān)測的研究進(jìn)展

    特性會發(fā)生顯著變化,例如: 葉綠素含量下降 :導(dǎo)致可見光波段(400-700 nm)反射率異常 細(xì)胞結(jié)構(gòu)破壞 :引起紅外波段(700-1300 nm)散射特征改變 水分與糖分異常 :影響短波紅外波段(1300-2500 nm)吸收峰分布 研究進(jìn)展與關(guān)鍵技術(shù)突破 (一)光
    的頭像 發(fā)表于 10-16 15:53 ?551次閱讀
    高光譜成像在作物病蟲害監(jiān)測的<b class='flag-5'>研究進(jìn)展</b>

    上市丨破局成長 智造未來

    20259月21日,思瑞浦迎來科創(chuàng)板上市年來,公司始終秉持“創(chuàng)新驅(qū)動、價值創(chuàng)造”的初心,持續(xù)加大研發(fā)投入,穩(wěn)步推進(jìn)平臺化建設(shè)與全
    的頭像 發(fā)表于 09-20 12:01 ?1272次閱讀
    上市<b class='flag-5'>五</b>周<b class='flag-5'>年</b>丨破局成長 智造未來

    中微半導(dǎo)產(chǎn)品選型手冊2025V2.0版

    產(chǎn)品的升級與創(chuàng)新。 2025V2.0版中文電子版產(chǎn)品選型手冊已正式上線,您可訪問中微半導(dǎo)官網(wǎng)www.MCU.com.cn【支持】——【下載中心】——【選型手冊】欄目,或者點(diǎn)擊下方二維碼在線閱讀或下載手冊
    發(fā)表于 09-04 13:35

    語音識別---大家怎么看呢?

    語音識別是一門交叉學(xué)科。二十年來,語音識別技術(shù)取得顯著進(jìn)步,開始從實(shí)驗(yàn)室走向市場。人們預(yù)計(jì),未來10內(nèi),語音
    發(fā)表于 08-09 10:54

    微雙重驅(qū)動的新型直線電機(jī)研究

    摘罷:大行程、高精度,同時易于小型化的移動機(jī)構(gòu)是先進(jìn)制造業(yè)等領(lǐng)域要解決的關(guān)鍵問題之一,綜述了現(xiàn)有宏/微雙重驅(qū)動機(jī)構(gòu)和直線超聲電機(jī)的研究進(jìn)展和存在問題,提出了一種宏微雙重驅(qū)動新型直線壓電電機(jī),使其既能
    發(fā)表于 06-24 14:17

    氧化鎵射頻器件研究進(jìn)展

    ,首先介紹了 Ga2O3在射頻器件領(lǐng)域的優(yōu)勢和面臨的挑戰(zhàn),然后綜述了近年來 Ga2O3射頻器件在體摻雜溝道、AlGaO/Ga2O3調(diào)制 摻雜異質(zhì)結(jié)以及與高導(dǎo)熱襯底異質(zhì)集成方面取得的進(jìn)展,并對研究結(jié)果進(jìn)行了討論,最后展望了未來 G
    的頭像 發(fā)表于 06-11 14:30 ?2477次閱讀
    氧化鎵射頻器件<b class='flag-5'>研究進(jìn)展</b>

    多光譜圖像技術(shù)在苗期作物與雜草識別中的研究進(jìn)展

    目前,田間雜草的識別方法主要有3種:人工識別法、遙感識別法和基于機(jī)器視覺的識別法,其中,人工識別法是世界上大多數(shù)國家和地區(qū)普遍沿用的方法,是
    的頭像 發(fā)表于 06-10 18:13 ?451次閱讀

    VirtualLab Fusion應(yīng)用:基于通道波導(dǎo)及二維擴(kuò)瞳器的眼顯示

    上海交通大學(xué)的智能顯示實(shí)驗(yàn)室(sdl.sjtu.edu.cn),提出了一種基于通道波導(dǎo)及二維擴(kuò)瞳器的眼顯示。如圖1所示,其基本架構(gòu)由(1)通道波導(dǎo)、(2)入耦合光柵(ICG)、(3)出耦合光柵
    發(fā)表于 06-03 08:47

    NVMe協(xié)議研究掃盲

    的不斷完善,越來越多的系統(tǒng)和應(yīng)用采用NVMe存儲接口的SSD,這種技術(shù)將成為未來存儲領(lǐng)域的主流。 NVMe研究進(jìn)展 目前,一些國內(nèi)外學(xué)者將NVMe SSD應(yīng)用于嵌入式存儲設(shè)備。例如Opsero公司的Jeff
    發(fā)表于 06-02 23:28

    2025村田電感型號命名規(guī)則深度解析

    電子元器件領(lǐng)域,村田作為全球知名的制造商,其電感產(chǎn)品憑借卓越性能和穩(wěn)定品質(zhì),廣泛應(yīng)用于通信、消費(fèi)電子、汽車電子等行業(yè)。隨著技術(shù)迭代,村田在2025對電感型號
    的頭像 發(fā)表于 04-15 14:29 ?1805次閱讀