收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

WEB上基于文本挖掘的个性化检索系统的设计与实现

杨瑞峰  
【摘要】:随着计算机的广泛使用和网络技术的发展,电子化信息越来越多,越来越多的信息积累在给我们带来方便的同时,也使我们面临着信息海量和知识贫乏的矛盾。如何才能从来自异构数据源的大量文本资源中提取出精练简洁的知识,满足某种特定的信息需要?数据挖掘技术(data mining)或基于数据库的知识发现技术(knowledge discovery in database , KDD)为解决这一问题提供了一种途径。本文描述了一个完整的综合医疗信息检索系统的实现,尝试基于文本数据的挖掘技术,为用户提供个性化检索服务。 个性化检索是基于知识发现的一种服务,作为一项综合技术,它涉及到数据挖掘、知识检索、计算机语言学、信息学等多个领域。区别于一般信息检索,“个性化”检索在方法论、检索目的以及评价方法上有明显不同。检索的个性化是基于数据挖掘过程中发现的隐含的、未知的、有用的知识来实现的。通过挖掘注册用户的访问日志,发现用户查询的关键词组合模式,即关联规则,来预测用户未来访问的关键词组合,并对用户作出提示,指引用户进行所需的选择。 河南省人民医院作为全省最大的综合性医疗服务部门,多年来积累了丰富的临床经验和科研成果以及病案资料。为了使信息使用者更方便地查询信息,院方建立了综合医疗信息数据库,并试图利用WWW信息发布方式,为用户提供良好的检索服务。综合医疗信息库检索系统平台设计与实现,为该院2002年科研项目之一。 本文是在参与河南省人民医院综合医疗信息网建设项目的基础上撰写完成的。文章的组织结构如下。全文共分六章。第一章阐述支撑个性化检索平台实现的基本技术。具体介绍了个性化检索、数据挖掘、关联规则以及Web数据库等系统开发所用到的基本技术。第二章从项目需求出发,介绍系统的总体规划和各子系统的选型情况。其中作为论文核心讨论的问题,在这里讨论个性化检索子系统所采用的经典频集算法。第三、第四、第五章依次介绍三个子系统:数据库后台录入管理子系统,一般检索子系统和注册用户个性化检索子系统的实现过程。第六章指出关联规则发现以及个性化应用的未来展望。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 李翠霞;林楠;;浅析文本挖掘技术[J];科技信息;2007年10期
2 邓英,李明;Web数据挖掘技术及工具研究[J];计算机工程与应用;2001年20期
3 孙吉红;焦玉英;;知识发现及其发展趋势研究[J];情报理论与实践;2006年05期
4 姜传菊;试论Web中的数据挖掘[J];现代图书情报技术;2003年S1期
5 ;浅析大规模文本数据挖掘技术在媒体中的创新应用[J];中国传媒科技;2007年11期
6 邓子平;张传宏;;面向医学的本体学习方法[J];计算机时代;2010年10期
7 赵慧勤;基于因特网的信息检索特点与发展趋势[J];情报理论与实践;2000年05期
8 崔志明,谢春丽;基于Web的文本挖掘研究[J];微电子学与计算机;2002年10期
9 胥桂仙,朴泰雄,杨丹丹,徐小博,高旭;中文文本挖掘中最长频繁序列的发现算法[J];中央民族大学学报(自然科学版);2004年01期
10 毛垣生;自建数据库中文本挖掘及检索技术[J];情报杂志;2004年04期
11 渡部勇;;文本挖掘技术应用于专利检索分析[J];微电脑世界;2007年12期
12 宋丹;许侃;林鸿飞;;文本挖掘中的知识模式表示、评价及检索机制[J];情报学报;2008年05期
13 王艳;数据挖掘在数字图书馆中的应用[J];现代图书情报技术;2002年05期
14 苏芳仲,林世平;Web文本挖掘中的一种中文分词算法研究及其实现[J];福州大学学报(自然科学版);2004年S1期
15 付国瑜;;Web文本分类挖掘[J];科学咨询(决策管理);2008年03期
16 曹丽君;刘西印;杨燕萍;;WEB页面文本挖掘的价值与未来探究[J];商场现代化;2008年09期
17 李孝军;;基于Web数据挖掘[J];科技创新导报;2008年14期
18 韩洁;;Web文本挖掘技术在信息生产领域的应用研究[J];硅谷;2010年08期
19 王艳;数据挖掘在数字图书馆中的应用[J];情报科学;2003年02期
20 张玉峰;朱莹;;基于Web文本挖掘的企业竞争情报获取方法研究[J];情报理论与实践;2006年05期
中国重要会议论文全文数据库 前10条
1 李阳;徐锡山;韩伟红;郑黎明;徐镜湖;;网络安全事件关联规则的自动化生成方法研究与实践[A];全国计算机安全学术交流会论文集·第二十五卷[C];2010年
2 左万利;刘居红;;包含正负属性的关联规则及其挖掘[A];第十六届全国数据库学术会议论文集[C];1999年
3 王宁;董淳;胡运发;陶晓鹏;;面向集合的关联规则挖掘算法[A];第十五届全国数据库学术会议论文集[C];1998年
4 周焕银;张永;;关联规则候选项频度规律研究[A];第二十届全国数据库学术会议论文集(技术报告篇)[C];2003年
5 方艳;别荣芳;;关联规则的有趣性研究[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
6 黄晓燕;许龙飞;;基于关联规则的网络入侵检测技术的应用研究[A];第二十三届中国数据库学术会议论文集(技术报告篇)[C];2006年
7 李庆忠;张世栋;董国庆;;在数据多维体中进行关联规则的挖掘[A];第十六届全国数据库学术会议论文集[C];1999年
8 韩涛;张春海;;关系数据库中关联规则的高效挖掘算法[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年
9 潘海为;李建中;张炜;;挖掘脑部医学图像中的关联规则[A];第十八届全国数据库学术会议论文集(研究报告篇)[C];2001年
10 周水庚;胡运发;陶晓鹏;;分布数据库关联规则的递增挖掘[A];第十五届全国数据库学术会议论文集[C];1998年
中国博士学位论文全文数据库 前10条
1 李芳;文本挖掘若干关键技术研究[D];北京化工大学;2010年
2 陈伟;基于时序文本挖掘的新闻内容理解与推荐技术研究[D];浙江大学;2010年
3 张翔;文本挖掘技术研究及其在综合风险信息网络中的应用[D];西北大学;2011年
4 徐建锁;知识管理和文本挖掘的若干问题研究[D];天津大学;2004年
5 温有奎;基于语义挖掘的文本知识元模型与应用研究[D];武汉大学;2010年
6 肖波;可信关联规则挖掘算法研究[D];北京邮电大学;2009年
7 王越;分布式关联规则挖掘的方法研究[D];重庆大学;2003年
8 周雪忠;文本挖掘在中医药中的若干应用研究[D];浙江大学;2004年
9 叶小飞;基于自发呈报系统与循证医学的药品不良反应信号挖掘[D];第二军医大学;2011年
10 伊卫国;基于关联规则与决策树的预测方法研究及其应用[D];大连海事大学;2012年
中国硕士学位论文全文数据库 前10条
1 杨瑞峰;WEB上基于文本挖掘的个性化检索系统的设计与实现[D];电子科技大学;2003年
2 郑东飞;基于XML的Web数据挖掘技术研究与实现[D];山东大学;2005年
3 姚继伟;基于XML的Web文本挖掘的研究[D];吉林大学;2010年
4 刘明岩;面向语义关系发现的文本挖掘研究[D];南京理工大学;2010年
5 李钝;基于粗糙集理论的文本挖掘技术研究[D];山西大学;2003年
6 杨斌;中文文本数据挖掘研究[D];湘潭大学;2002年
7 程春惠;公安犯罪案件文本挖掘关键技术研究[D];浙江大学;2010年
8 徐爱华;面向文本分类的中文文本挖掘技术研究及实现[D];武汉理工大学;2004年
9 刘岩;基于Web的文本挖掘技术的研究[D];哈尔滨工程大学;2004年
10 靳晓恩;数字图书馆的知识发现研究[D];湘潭大学;2008年
中国重要报纸全文数据库 前10条
1 本报记者 施鹏;非结构信息和文本挖掘[N];21世纪经济报道;2009年
2 周青 编译;文本挖掘工具实现非结构化数据价值[N];计算机世界;2004年
3 ;SAS公司收购Teragram 强化BI领域地位[N];计算机世界;2008年
4 本报记者 张晶;怎样挖掘专家的活的经验和智慧[N];科技日报;2011年
5 汪洋 编译;BI平民化[N];计算机世界;2004年
6 靳辉;垂直搜索:呼叫经济发展的核心动力[N];通信产业报;2007年
7 缪其浩记者 江世亮;非官方信息源担当应急预警器[N];文汇报;2008年
8 严宁;挖掘数据寻保险商机[N];网络世界;2007年
9 张德政;信息挖掘商业智能之“芯”[N];中国计算机报;2002年
10 本报记者 张承东;挖潜无极限[N];网络世界;2006年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978