收藏本站
《第二军医大学》 2004年
收藏 | 手机打开
二维码
手机客户端打开本文

基于知识分词算法的病案全文检索系统

夏洪斌  
【摘要】:随着科技的发展和经济的腾飞,图书馆、新闻出版、企业等单位电子数据激增,可供人们选择的信息迅速膨胀。这些文档常常并非存在于结构化的数据库中,以TXT, DOC, HTML,XML, XLS, PPT, PDF等多种文档格式存储。当人们需要某方面信息的时候,就要从这大量的文档中提取有用的信息。然而目前的全文检索系统或因特网搜索对中文信息在查全率和查准率很难让用户满意,这很大程度上与中文的语言特性相关。 本课题的研究重点是中文分词。汉语自动分词是中文信息处理技术的“瓶颈”问题。各类分词算法不下几十种。围绕提高分词效率和精度,减少歧义,本文提出了知识分词的思路,以各类知识体系为基础建立分词系统。 数据库全文检索技术也获得了蓬勃的发展。各大数据库厂商大都为自己的数据库配置了全文检索引擎。由于这种引擎是完全集成在数据库中的,因此具有很高的效率,并且管理方便,易于使用,容易与数据库应用系统相关联。本课题利用ORACLE大型数据库提供的全文检索引擎Oracle Text 建立一个病案全文检索系统,并将分词系统与Oracle Text建立关联,提高全文检索的查全率与查准率。 论文第一章概述了信息检索目前的应用现状和现实需求,阐述了本课题研究依赖的理论知识,阐明了课题的性质、课题的研究重点。第二章介绍全文检索技术的原理和发展趋势。第三章介绍各类汉语分词算法。第四章对知识分词系统进行了研究和实践。第五章对病案全文检索系统在ORACLE数据库中的实现进行了介绍。
【学位授予单位】:第二军医大学
【学位级别】:硕士
【学位授予年份】:2004
【分类号】:G354

手机知网App
【引证文献】
中国硕士学位论文全文数据库 前5条
1 赵会杰;中文全文检索系统中索引的研究[D];北京交通大学;2007年
2 朱惠娥;中文科技文献网络搜索引擎自动文摘系统的设计与实现[D];吉林大学;2008年
3 王晓;电子病历智能全文检索研究[D];第四军医大学;2008年
4 洪田玉;一种开放式高性能全文检索平台的研究与实现[D];中南大学;2009年
5 薛惠;基于JAVA的移动新闻搜索引擎的研究与设计[D];河北科技大学;2010年
【参考文献】
中国期刊全文数据库 前10条
1 陈桂林,王永成,韩客松,王刚;一种改进的快速分词算法[J];计算机研究与发展;2000年04期
2 雷鸣,刘建国,王建勇,陈葆珏;一种基于词典的搜索引擎系统动态更新模型[J];计算机研究与发展;2000年10期
3 孙建军,陈肇雄,薛选民,郭喜林,侯敏;基于多功能逻辑运算分析技术的汉语分词[J];计算机研究与发展;1998年05期
4 欧振猛,余顺争;中文分词算法在搜索引擎应用中的研究[J];计算机工程与应用;2000年08期
5 严威,赵政;开发中文搜索引擎汉语处理的关键技术[J];计算机工程;1999年06期
6 邓伟,张志伟,谭庆平,宁洪;一种新型的智能搜索引擎[J];计算机工程;2000年03期
7 应志伟,柴佩琪,陈其晖;文语转换系统中基于语料的汉语自动分词研究[J];计算机应用;2000年02期
8 韩客松,王永成,陈桂林;汉语语言的无词典分词模型系统[J];计算机应用研究;1999年10期
9 邹海山,吴勇,吴月珠,陈阵;中文搜索引擎中的中文信息处理技术[J];计算机应用研究;2000年12期
10 李志蜀,李果;中文搜索引擎的原理剖析及开发实现技术[J];计算机应用研究;2001年11期
【共引文献】
中国期刊全文数据库 前10条
1 邓岳辉,杨以涵,谢宇正,李钢;智能变电站、发电厂倒闸操作及培训专家系统[J];华北电力大学学报;1998年03期
2 董法军,韩燮;基于超媒体的智能教学系统的设计与开发[J];华北工学院学报;2000年04期
3 廖家平,舒军,王粟;基于 PDC-PROLOG 自学习机器博弈[J];湖北工学院学报;1997年04期
4 马洪森,曹克强,杨庆,邝朴生;小麦病虫害治理决策支持系统[J];河北省科学院学报;1995年Z1期
5 于张红;蹇玉清;张海涛;王建猛;王纲;;课程词典系统的设计[J];河北科技师范学院学报;2007年03期
6 牛奔,哈明虎,王熙照;基于VC和VIP的面向对象知识表示[J];河北科技大学学报;2002年01期
7 王铮,胡永杰;元搜索引擎的设计与实现[J];河北师范大学学报;2001年02期
8 张剑;;图像分割技术的研究[J];信息技术;2011年10期
9 刘挺,吴岩,王开铸;中文自动文摘系统CAAS的研究与实现[J];哈尔滨工业大学学报;1999年06期
10 梁华参;赵铁军;薛永增;孙加东;;词汇相似度约束的短语抽取[J];哈尔滨工业大学学报;2010年05期
中国重要会议论文全文数据库 前10条
1 王剑平;黄红霞;李宏彪;张云生;;基于支持向量机模型的瓦斯涌出量预测[A];第二十七届中国控制会议论文集[C];2008年
2 曹红;袁津生;;多领域主题搜索引擎研究[A];第一届全国Web信息系统及其应用会议(WISA2004)论文集[C];2004年
3 高楚舒;丁于思;;因特网中文文本信息分析[A];计算机模拟与信息技术会议论文集[C];2001年
4 黎琳;;Web内容挖掘在数字图书馆中的应用[A];中国工程物理研究院第七届电子技术青年学术交流会论文集[C];2005年
5 柏桂荣;章勇;;基于RSS的用户兴趣模型研究[A];2009通信理论与技术新发展——第十四届全国青年通信学术会议论文集[C];2009年
6 高秀恒;钱红兵;;一种基于Agent增强的软件审查过程模型[A];计算机技术与应用进展·2007——全国第18届计算机技术与应用(CACIS)学术会议论文集[C];2007年
7 任玉辉;张涛;柏庆岩;钱学明;张东平;王云川;;轧钢加热炉加热过程最优控制与智能系统的开发与应用[A];2005中国钢铁年会论文集(第4卷)[C];2005年
8 陶钧;朱学其;林文喜;;高炉配料自动控制方法研究[A];2008年全国炼铁生产技术会议暨炼铁年会文集(下册)[C];2008年
9 万敏;罗振声;郭玉箐;;自动文摘系统中的意义段划分问题研究[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
10 朱晓丹;刁倩;周富秋;;汉语词语的两字hash算法[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
中国博士学位论文全文数据库 前10条
1 郑军红;基于知识工程的智能夹具设计系统构建研究[D];浙江大学;2010年
2 许有军;基于扩展规则的若干SAT问题研究[D];吉林大学;2011年
3 杨抒;基于WEB的林产品信息资源整合方法研究[D];北京林业大学;2011年
4 马丽娜;模糊推理方法及知识推理的计量化研究[D];陕西师范大学;2011年
5 胡明娣;逻辑度量空间的内蕴结构的研究[D];陕西师范大学;2011年
6 斯·劳格劳;现代蒙古语依存句法自动分析研究[D];内蒙古大学;2011年
7 张鸿辉;多智能体城市规划空间决策模型及其应用研究[D];中南大学;2011年
8 缪鹍;公(铁)工程三维选线的群智能算法研究[D];中南大学;2011年
9 田俊华;基于本体知识库的教学资源自动采集技术研究[D];南京师范大学;2011年
10 刘新全;城市群卫星城市区驾驶者出行行为研究[D];西南交通大学;2011年
中国硕士学位论文全文数据库 前10条
1 白冰;基于数据处理中心的企业竞争情报系统研究[D];山东科技大学;2010年
2 徐财应;基于Lucene的搜索引擎技术的研究与改进[D];长春理工大学;2010年
3 朱谦成;基于CLIPS的注塑模具方案智能设计研究及程序实现[D];湘潭大学;2010年
4 胡志敏;互联网文本自动文摘技术的研究[D];湘潭大学;2010年
5 吴世汉;面向查询的XML文本摘要技术[D];江西财经大学;2010年
6 冯晶晶;面向软件测试领域的自动问答系统[D];河南理工大学;2010年
7 徐旭;基于决策树的Web应用系统个性化身份验证研究[D];合肥工业大学;2010年
8 林良健;电网调度智能防误系统研究[D];华南理工大学;2010年
9 郭瞳康;基于词典的中文分词技术研究[D];哈尔滨理工大学;2010年
10 万亚楠;基于SAP系统的两票防误系统的研发与应用[D];华南理工大学;2010年
【同被引文献】
中国期刊全文数据库 前10条
1 蒋斌;杨超;赵欢;;基于二字词位图表的汉语自动分词词典机制[J];湖南大学学报(自然科学版);2006年01期
2 陈桂林,王永成,韩客松,王刚;一种改进的快速分词算法[J];计算机研究与发展;2000年04期
3 李蕾,钟义信,郭祥昊;面向特定领域的理解型中文自动文摘系统[J];计算机研究与发展;2000年04期
4 张长利,赫枫龄,左万利;一种基于后缀数组的无词典分词方法[J];吉林大学学报(理学版);2004年04期
5 赫枫龄;左万利;张雪松;;高性能网页索引器JU_Indexer的实现[J];吉林大学学报(理学版);2006年01期
6 王冬;左万利;赫枫龄;彭涛;张长利;;一种增量倒排索引结构的设计与实现[J];吉林大学学报(理学版);2007年06期
7 欧振猛,余顺争;中文分词算法在搜索引擎应用中的研究[J];计算机工程与应用;2000年08期
8 陈燕娜,邵志清;基于全文搜索的中文搜索引擎设计技术[J];计算机工程与应用;2002年17期
9 赵汀,孟祥武;基于LUCENEAPI的中文全文数据库设计与实现[J];计算机工程与应用;2003年20期
10 周锦煌,黄穗;一个基于XML的电子病历系统模型的设计[J];计算机工程与应用;2004年21期
中国博士学位论文全文数据库 前1条
1 郑义;多媒体信息自动摘要及其相关技术研究[D];复旦大学;2003年
中国硕士学位论文全文数据库 前8条
1 赵鹏;基于数据压缩的信息检索技术的研究[D];黑龙江大学;2002年
2 徐蓉;实时系统的内存管理技术研究与实现[D];电子科技大学;2004年
3 刘兴宇;基于倒排索引的全文检索技术研究[D];华中科技大学;2004年
4 张校乾;基于Lucene的全文检索系统的研究与应用[D];大连理工大学;2005年
5 明廷波;基于神经网络的Web信息抽取系统的研究与实现[D];电子科技大学;2006年
6 申飞驹;基于Web的电子病历系统分析与设计[D];苏州大学;2006年
7 程娟;中文文档自动摘要技术[D];山东大学;2006年
8 高少琛;基于查询拓展和聚类技术的资源检索系统的研究与应用[D];上海交通大学;2007年
【二级引证文献】
中国硕士学位论文全文数据库 前1条
1 刘邵斌;专家信息垂直搜索引擎关键技术研究与实现[D];中南大学;2010年
【二级参考文献】
中国期刊全文数据库 前10条
1 张国煊,王小华,周必水;快速书面汉语自动分词系统及其算法设计[J];计算机研究与发展;1993年01期
2 陈桂林,王永成,韩客松,王刚;一种高效的中文电子词表数据结构[J];计算机研究与发展;2000年01期
3 吴胜远;一种汉语分词方法[J];计算机研究与发展;1996年04期
4 孙茂松,黄昌宁,邹嘉彦,陆方,沈达阳;利用汉字二元语法关系解决汉语自动分词中的交集型歧义[J];计算机研究与发展;1997年05期
5 路海明,卢增祥,徐晋晖,李衍达;基于Agent技术的个性化主动信息服务[J];计算机工程与应用;1999年06期
6 梁意文,曹霞,董红斌;一种基于智能体的Web文档预取模式[J];计算机工程与应用;2001年04期
7 解冲锋,李星;并行式Meta Search系统的设计与实现[J];计算机工程与应用;1999年02期
8 冯志伟;;国外主要自然语言理解系统概况[J];计算机科学;1984年02期
9 周会平;王挺;史晓东;陈火旺;齐璇;;一个基于中间语言的汉英机器翻译系统[J];计算机科学;1998年05期
10 路海明;卢增祥;李衍达;;基于信息Agent通知站点内容的有价值变化[J];计算机科学;2000年09期
【相似文献】
中国期刊全文数据库 前10条
1 赵劲秋,张五润;小议病案的开发利用[J];浙江档案;2000年01期
2 赵智,弓小克,赵慧,牛忠献;病案光盘存储系统的几点思考[J];浙江档案;1997年09期
3 张荫松;由长期保存的病案新用途看科学保存的必要性[J];数字与缩微影像;2004年01期
4 王力纲,孙丽芳,白秀梅;基于TRS系列产品制作的三大索引全文检索系统[J];现代情报;2004年07期
5 张玉芬;关于病案进馆问题的探讨[J];档案学研究;1996年03期
6 孙小虹;浅谈病案的计算机管理[J];浙江档案;1996年12期
7 陈路;病案微机管理之优劣[J];浙江档案;1997年11期
8 曹印专;举证责任倒置下的医院病案管理[J];湖南档案;2002年06期
9 陈健;中国古代病案考[J];浙江档案;2002年11期
10 杜志红;TIR全文检索系统[J];软件世界;1997年03期
中国重要会议论文全文数据库 前10条
1 刘虹群;;浅议归档病案的装订[A];第13届全国病案管理学术会论文汇编[C];2004年
2 张坤华;马武琼;;未来我国病案管理发展的展望[A];第五届全国病案管理学术会议论文集[C];1995年
3 杨瑞丽;;病案中存在的问题与解决方法[A];第13届全国病案管理学术会论文汇编[C];2004年
4 朱登平;;病案管理流程初探[A];第13届全国病案管理学术会论文汇编[C];2004年
5 刘虹群;;谈基层医院病案管理质量及工作流程设计[A];第13届全国病案管理学术会论文汇编[C];2004年
6 周淑芳;邱杰;;浅谈病案的法治化管理[A];第13届全国病案管理学术会论文汇编[C];2004年
7 宋渝飞;屈超娟;;病案现代新技术管理中应注意的问题[A];第13届全国病案管理学术会论文汇编[C];2004年
8 刘芸;伊慧荣;;浅谈病案流程的规范化管理[A];第13届全国病案管理学术会论文汇编[C];2004年
9 毛勇;李霞;李芳红;;住院病案保存的规范管理[A];第13届全国病案管理学术会论文汇编[C];2004年
10 ;影像病案网络管理系统北京腾基伟业网络技术有限公司[A];第13届全国病案管理学术会论文汇编[C];2004年
中国重要报纸全文数据库 前10条
1 陈光良;谈防治非典时期的病案档案管理工作[N];中国档案报;2003年
2 章安人;献给编辑记者的书[N];中国社会科学院院报;2007年
3 通讯员 王琳 申显龙;双辽市积极组织病案巡展活动[N];四平日报;2009年
4 杨敏;一种新型病案电子记事本问世[N];健康报;2000年
5 张宏 宋云霞 陆虹;脉络宁注射液不良反应病案摘录[N];农村医药报(汉);2004年
6 ;王琦教授治疗尿毒症病案[N];中国中医药报;2005年
7 实习记者 刘永远;丢弃就诊卡会带来不便[N];阿勒泰日报;2009年
8 北京协和医院 段文利;保护病历 珍重生命[N];中国消费者报;2001年
9 上海市执业药师协会 邬时民;中医何日走出“围城”[N];光明日报;2009年
10 南京中医药大学 周仲瑛;漫话中医传承[N];中国中医药报;2010年
中国博士学位论文全文数据库 前10条
1 吴炜;密文全文检索系统中的索引机制研究[D];华中科技大学;2009年
2 杜文宏;基于知识管理的公共物流信息平台构建的理论与方法[D];西南交通大学;2011年
3 周福战;基于知识的高新技术企业人力资源管理活动研究[D];大连理工大学;2011年
4 秦昆;基于形式概念分析的图像数据挖掘研究[D];武汉大学;2004年
5 高军;基于知识的冷挤压工艺设计智能系统及其关键技术研究[D];山东大学;2005年
6 伍勇;空时自适应杂波抑制[D];清华大学;2008年
7 蔡波;虚拟企业基于知识的产品概念设计研究[D];西北工业大学;2002年
8 陈燕娟;基于知识产权视角的中国种子企业发展战略研究[D];华中农业大学;2012年
9 石杰;基于知识的企业战略管理系统及其模型研究[D];西北工业大学;2003年
10 张凌志;基于知识进化观的企业创新模式研究[D];天津大学;2012年
中国硕士学位论文全文数据库 前10条
1 夏洪斌;基于知识分词算法的病案全文检索系统[D];第二军医大学;2004年
2 曾剑锋;毕业论文全文检索系统的设计与实现[D];电子科技大学;2012年
3 杨镒菲;基于云存储的分布式全文检索系统的设计与实现[D];华南理工大学;2012年
4 王红胜;多文档全文检索系统的设计与开发[D];电子科技大学;2010年
5 刘超;专利全文检索系统的设计与实现[D];北京邮电大学;2010年
6 卢志翔;全文检索系统研究[D];广西大学;2011年
7 高欣;基于Lucene的全文检索系统的研究与实现[D];天津师范大学;2010年
8 马静;基于web的数字化资源全文检索系统的设计与实现[D];西安电子科技大学;2010年
9 李爱贞;基于Lucene的毕业论文库全文检索系统的设计与实现[D];中国海洋大学;2011年
10 王腾飞;基于Solr的分布式实时全文检索系统的设计与实现[D];云南大学;2012年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026