收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于双层标注的中文电子病历命名实体识别

张知菲  
【摘要】:计算机信息技术的发展带来了海量的医疗数据。作为临床信息系统最重要的组成部分,电子病历记录了患者诊疗过程中的详细信息,包含了众多宝贵的医疗资源。电子病历中的自由文本以半结构或是无结构的形式存在,要将这些非结构化的病历数据所包含的有效信息快速提取出来,采用自然语言处理技术进行文本挖掘是必不可少的。命名实体识别是文本数据挖掘的关键技术,因此,对电子病历中的医疗实体进行识别具有重要作用。本研究提出了一种基于领域词典和条件随机场的双层标注模型。该模型通过构建一个小规模的医疗领域词典,再结合条件随机场,进行了两次不同粒度的标注,对中文电子病历中的疾病、症状、操作、药品四类医疗实体进行识别。同时对比分析了深度神经网络的识别效果。本文的主要内容包括以下部分:(1)利用统计方法从中文电子病历中获取关键词以及利用外部专业资源获取关键词这两种途径构建领域词典,并标注中文电子病历命名实体识别标注语料库。(2)基于双层标注的中文电子病历命名实体识别。将富含领域知识的领域词典与序列标注算法CRF相结合,提出了一种一次预标注-二次精确标注的双层标注模型。通过两次不同粒度的标注,将领域词典的准确性和机器学习的自动性融为一体。经过测试评估,基于小规模标注语料,该模型就能达到96.7%Macro-P、97.7%Macro-R、97.2%Macro-F1的实体识别结果。(3)双层标注模型与深度学习对医疗实体识别的比较分析。通过领域语料预训练以及对已有模型进行Fine-tuning两种方式对深度学习进行领域预处理,采用基于Bi LSTM-CRF和Transformer-CRF两种模型比较了双层标注模型和深度学习对中文电子病历命名实体识别的区别。(4)双层标注模型的其他应用。证明了双层标注模型对中文电子病历医疗实体识别具有普适的高效性。然后使用双层标注模型对医院真实儿科病历进行医疗实体识别,并从识别结果中发现了儿科常见发病特点。本文提出的中文电子病历命名实体识别的方法,表现出了优秀的识别效果,能够高效、快速地从非结构化的电子病历中自动识别出医疗实体,从而为进一步的医疗信息抽取奠定了基础。


知网文化
【相似文献】
中国期刊全文数据库 前15条
1 赵鸿阳;;基于深度学习的电子病历命名实体识别的研究与实现[J];软件;2019年08期
2 夏宇彬;郑建立;赵逸凡;徐霄玲;;基于深度学习的电子病历命名实体识别[J];电子科技;2018年11期
3 郁小玲;张铁山;吴彤;方明哲;黄建一;胡长军;;基于两位一体的中文电子病历命名实体识别[J];中国卫生信息管理杂志;2017年04期
4 ;阿里健康拿下中文电子病历实体识别全国冠军[J];科技新时代;2018年04期
5 马欢欢;孔繁之;高建强;;中文电子病历命名实体识别方法研究[J];医学信息学杂志;2020年04期
6 蒋志鹏;赵芳芳;关毅;杨锦锋;;面向中文电子病历的词法语料标注研究[J];高技术通讯;2014年06期
7 ;国家卫生计生委印发电子病历应用管理规范(试行)[J];吉林医学信息;2017年02期
8 ;电子病历新规:住院电子病历保存不少于30年[J];吉林医学信息;2017年04期
9 李颖;;电子病历想说共享不容易 监管尚存在管理漏洞[J];吉林医学信息;2017年11期
10 耿美;;电子病历建设研究[J];科技档案;2011年03期
11 刘辉;徐乐勤;陈少玫;;厦门市中医门诊电子病历云的建设与应用[J];中国卫生信息管理杂志;2019年06期
12 高诗;徐薇;王美芹;;加密云存储电子病历系统应用研究[J];中国数字医学;2020年02期
13 郑杰;王留明;程龙;程明珍;蒋海泥;张颢;;大型三甲医院医生对门诊电子病历使用意愿的调查研究[J];中国数字医学;2020年02期
14 吴凤梅;;电子病历智能系统的优化研究[J];网络安全技术与应用;2020年06期
15 罗志恒;;云密钥系统在门诊电子病历的应用[J];科技创新导报;2020年11期
中国重要会议论文全文数据库 前20条
1 汤霞;;电子病历在病案管理中的优势与发展趋势[A];2018年教师教育能力建设研究专题研讨会论文集[C];2018年
2 肖丽;胡禄;朱艳红;李虹丽;王金全;温川飙;;数据挖掘在中医电子病历上的应用[A];第五届中国中医药信息大会——大数据标准化与智慧中医药论文集[C];2018年
3 高文慧;徐梦;;电子病历建设现状分析与思考[A];第五届中国中医药信息大会——大数据标准化与智慧中医药论文集[C];2018年
4 郭磊;;中医电子病历开发与应用[A];中国中医药信息研究会第三届理事大会暨学术交流会议论文汇编[C];2013年
5 张红;李婧;马兆辉;刘堃靖;姜又琳;杨睿;;中医电子病历基本数据集标准的研究[A];第四届中国中医药信息大会论文集[C];2017年
6 程小恩;温川飙;尹泽玲;;一种中医临床数据的清洗方法[A];第五届中国中医药信息大会——大数据标准化与智慧中医药论文集[C];2018年
7 毛琦善;程东升;;电子病历在“三好一满意”活动中的实践与体会[A];山东省医学伦理学学会第八届学术年会论文集[C];2012年
8 刘强;曹磊;;优化初始聚类中心的电子病历聚类算法[A];中华医学会第二十一次全国医学信息学术会议论文汇编[C];2015年
9 杨柳;;电子病历在病案管理中的应用及问题[A];中华医学会第二十一次全国医学信息学术会议论文汇编[C];2015年
10 苏勇;;电子病历知识库建设及分析[A];中华医学会第二十一次全国医学信息学术会议论文汇编[C];2015年
11 丁中印;张新高;谷运麒;何仁德;彭华;王胜;;基于电子病历的医院信息平台应用[A];中华医学会第二十一次全国医学信息学术会议论文汇编[C];2015年
12 罗悦;严小英;温川飙;;浅析中医电子病历标准化[A];中华医学会第二十一次全国医学信息学术会议论文汇编[C];2015年
13 张晔;张晗;赵玉虹;;浅谈电子病历信息提取技术[A];中华医学会第二十一次全国医学信息学术会议论文汇编[C];2015年
14 解学术;甄天民;赵伟力;;山东省医院电子病历建设及利用现状分析[A];中华医学会第二十一次全国医学信息学术会议论文汇编[C];2015年
15 张凤春;;电子病历时代已悄然走来[A];第十九届全国肿瘤医院管理学术研讨会论文汇编[C];2009年
16 李杨;夏志伟;吴虎兵;;应用电子病历对临床工作的影响——针对医护人员的调查[A];中国医院协会病案管理专业委员会第二十届学术会议论文集[C];2011年
17 王云霞;李亚峰;;基层医院电子病历应用效果观察[A];第15届全国老年护理学术交流会议论文汇编[C];2012年
18 卢桂英;李锦红;黄美娇;冯丽英;梁细妹;梁彩玲;;电子病历在人工授精和试管婴儿治疗周期中的应用初探[A];全国妇产科新技术、新理论进展研讨会论文汇编[C];2012年
19 陈立红;;推行电子病历要过“五关”[A];中国医院协会病案管理专业委员会第二十二届学术会议论文集[C];2013年
20 陈士元;;电子病历引发纠纷的成因与对策[A];中国医院协会病案管理专业委员会第二十二届学术会议论文集[C];2013年
中国博士学位论文全文数据库 前19条
1 周阳;基于机器学习的医疗文本分析挖掘技术研究[D];北京交通大学;2019年
2 蒋志鹏;中文电子病历的词法和句法分析研究[D];哈尔滨工业大学;2017年
3 李哲;医疗机构电子病历长期保存的风险防范研究[D];郑州大学;2019年
4 生慧;大数据背景下中医电子病历关键问题研究[D];山东中医药大学;2017年
5 张佳玥;电子病历检索中时序语义相似度研究[D];北京邮电大学;2018年
6 栗伟;电子病历文本挖掘关键算法研究[D];东北大学;2014年
7 徐凯;面向医学命名实体识别的深度学习方法研究[D];广东工业大学;2019年
8 朱锁玲;命名实体识别在方志内容挖掘中的应用研究[D];南京农业大学;2011年
9 付瑞吉;开放域命名实体识别及其层次化类别获取[D];哈尔滨工业大学;2014年
10 魏泉;基于本体的电子病历研究[D];武汉大学;2010年
11 罗芳;意见挖掘中若干关键问题研究[D];武汉理工大学;2011年
12 李昊旻;电子病历的标准化结构化方法研究及实践[D];浙江大学;2007年
13 夏琦;肝衰竭临床科研系统和慢加急性肝衰竭预后模型的建立[D];浙江大学;2014年
14 俞磊;基于物联网技术的智慧医院架构及服务访问研究[D];合肥工业大学;2014年
15 李广曦;适用于脾虚证数据采集的完全结构化电子病历的构建[D];广州中医药大学;2005年
16 张坤丽;基于知识融合的产科电子病历多标记分类研究[D];郑州大学;2019年
17 屠海波;电子病历信息模型及其应用[D];第四军医大学;2010年
18 林文敏;云环境下大数据服务及其关键技术研究[D];南京大学;2015年
19 陈守强;丁书文教授用药规律的计算机辅助分析[D];山东中医药大学;2005年
中国硕士学位论文全文数据库 前20条
1 张知菲;基于双层标注的中文电子病历命名实体识别[D];南京邮电大学;2020年
2 姜涛;中文电子病历的新词发现及实体识别研究[D];合肥工业大学;2020年
3 江涛;基于深度神经网络的电子病历命名实体识别关键技术研究与应用[D];电子科技大学;2020年
4 周侗;面向中文电子病历的医疗实体及关系识别技术研究[D];西北师范大学;2020年
5 张建;电子病历数据分析系统的设计与实现[D];河南大学;2019年
6 祖木然提古丽·库尔班;基于神经网络的电子病历实体识别[D];新疆大学;2019年
7 许亮业;基于电子病历的会诊系统设计与实现[D];上海交通大学;2016年
8 肖严;基于深度学习的电子病历应用与研究[D];电子科技大学;2019年
9 张昱;基于深度学习的中文电子病历实体及其修饰识别技术研究[D];西北师范大学;2019年
10 孟捷;基于中文电子病历文本的医学语义网络构建方法研究[D];北京交通大学;2019年
11 夏国卿;基于半监督条件随机场的中文电子病历分词研究与应用[D];上海交通大学;2018年
12 蔡成彰;中文电子病历医学实体识别算法研究[D];电子科技大学;2019年
13 郭煜;基于深度学习的脑血管病电子病历辅助诊疗研究[D];北京交通大学;2019年
14 曹辉;基于区块链技术的脑卒中电子病历数据存储系统研究[D];北京交通大学;2019年
15 邓春云;面向临床决策支持的放射学报告分析[D];云南大学;2018年
16 秦雯;电子病历证据的真实性及其认定[D];重庆邮电大学;2018年
17 庄浩杰;基于电子病历分析处理的机器学习算法研究[D];华南理工大学;2019年
18 修晓蕾;基于中文电子病历的肿瘤知识图谱构建研究[D];北京协和医学院;2019年
19 孙雪松;基于电子病历的护理风险预警模型设计[D];上海交通大学;2016年
20 张琳浩;基于信息熵的电子病历隐私保护访问控制研究[D];石家庄铁道大学;2019年
中国重要报纸全文数据库 前20条
1 张思玮;电子病历:光明之路亦有坎坷[N];科学时报;2011年
2 记者 张启民;赤峰学院附属医院成为自治区首家电子病历高级别医院[N];赤峰日报;2019年
3 记者 刘良龙;苏忠阳委员:建立粤港澳大湾区统一电子病历[N];深圳特区报;2020年
4 高波 特约记者 海洋;装备“电子病历”助力精准排障[N];解放军报;2020年
5 首席记者 姚常房;电子病历分级评价标准明确[N];健康报;2018年
6 本报记者 李禾;电子病历:要便捷更要安全[N];科技日报;2018年
7 罗志华;电子病历模块化风险不容忽视[N];中国人口报;2019年
8 东莞时报记者 李春燕 黄月 覃志杰 庄嘉颖;推进区域电子病历共享平台建设 今年实现电子健康码“一码通用”[N];东莞日报;2019年
9 秋实 医生;电子病历时代要防范新风险[N];健康报;2019年
10 唐传艳;普及电子病历应一步跨过多道门槛[N];嘉兴日报;2019年
11 罗志华;普及电子病历应“一步跨过多门槛”[N];宁波日报;2019年
12 记者 孙燕明;首个世界患者安全日 “电子病历管理”被纳入安全目标[N];中国消费者报;2019年
13 毛建国;共享电子病历惟其难更显勇毅[N];贵州日报;2017年
14 胡湖 记者 孙兴维;全军医院电子病历信息共享平台联通上线[N];解放军报;2017年
15 记者 黄辉;完善法规提高“电子病历”有效性[N];法制日报;2018年
16 卞心龙 王良勇;设备有了“电子病历”[N];东方烟草报;2018年
17 记者 张灿灿;我国电子病历应用水平待提高[N];健康报;2018年
18 特约记者 张婉欣 记者 张楠;新疆进一步规范管理电子病历[N];健康报;2018年
19 舒心萍;电子病历“共享调阅”值得推广[N];经济日报;2018年
20 西南医科大学法学院 万力 重庆医科大学 王政;电子病历证据:法律界定要清晰[N];健康报;2018年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978