收藏本站
《湖南大学》 2003年
收藏 | 手机打开
二维码
手机客户端打开本文

关联规则挖掘及其在概念检索中的应用研究

谭义红  
【摘要】: 随着因特网技术的迅速发展,因特网上信息成几何级数增长,传统的信息检索服务已不能满足用户的检索需求,因此智能信息检索成为重要的研究课题。概念检索是实现智能信息检索的重要方式之一。本文针对目前概念检索系统中存在的问题,利用关联规则挖掘技术,挖掘概念之间的关联和层次关系,自动构建概念树,实现概念检索。 本文首先介绍了概念检索和关联规则挖掘的发展概况和基本概念,在此基础上,分析了概念检索中存在的问题。针对自动从文档中导出关键词/词条之间的关联性问题,本文在深入研究加权挖掘算法和向量空间模型中权值特点的基础上,提出一种矩阵加权关联规则挖掘算法。该算法首先根据k-权值估计思想找出频繁项集,然后根据矩阵加权置信度找出关联规则。实验结果表明,该算法能有效地解决上述问题。针对交互式挖掘关联规则的问题,本文将查询表达式作为约束条件来挖掘相关的关联规则,在分析现有约束关联规则挖掘算法的基础上,提出一种基于两阶段的约束关联规则挖掘算法。该算法利用已挖掘的关联规则,实现约束关联规则的挖掘过程。由于在约束条件挖掘的过程中不需要再对数据库进行挖掘处理,算法可以节省大量时间,提高了查询效率。实验结果验证了这一结论。本文还针对查询扩展的问题,提出了一种基于规则的概念关联扩展检索技术以及概念层次的生成方法,该方法根据关键词/词条之间的关联规则,将查询表达式扩展为相关的表达式,提交给系统执行检索,提高了查全率和查准率。本文在已有关联规则挖掘算法的基础上,结合所提出的改进算法及技术,最后实现了一个基于关联规则挖掘的中文概念检索系统原型。
【学位授予单位】:湖南大学
【学位级别】:硕士
【学位授予年份】:2003
【分类号】:TP311.13

【引证文献】
中国期刊全文数据库 前1条
1 黄名选;严小卫;张师超;;查询扩展技术进展与展望[J];计算机应用与软件;2007年11期
中国硕士学位论文全文数据库 前8条
1 吕芳芳;基于查询扩展的垂直搜索研究[D];山东科技大学;2010年
2 黄名选;基于完全加权关联规则挖掘的查询扩展研究[D];广西师范大学;2007年
3 刘恒文;基于网络语义挖掘的舆情监测预警研究[D];武汉理工大学;2010年
4 陈俊奎;基于语义扩展的搜索引擎研究[D];华东师范大学;2012年
5 王磊;基于概念语义空间的语义查询扩展技术研究[D];河南科技大学;2012年
6 戚璐瑶;一种基于关联规则挖掘的查询扩展算法及应用研究[D];南京航空航天大学;2012年
7 李涛;基于关联规则的查询扩展技术研究[D];解放军信息工程大学;2012年
8 刘强;面向查询语句的扩展过滤及权重计算研究[D];华中师范大学;2013年
【参考文献】
中国期刊全文数据库 前10条
1 周斌,吴泉源,高洪奎;序列模式挖掘的增量式算法的设计原则[J];计算机研究与发展;2000年10期
2 王继成,萧嵘,孙正兴,张福炎;Web信息检索研究进展[J];计算机研究与发展;2001年02期
3 寇育敬,王春花,黄厚宽;约束关联规则的增量式维护算法[J];计算机研究与发展;2001年08期
4 周皓峰,朱扬勇,施伯乐;一个基于兴趣度的关联规则采掘算法[J];计算机研究与发展;2002年04期
5 邹涛,王继成,朱华宇,金翔宇,张福炎;WWW上的信息挖掘技术及实现[J];计算机研究与发展;1999年08期
6 李蕾,王楠,张剑,钟义信,郭祥昊,贾自燕;中文搜索引擎概念检索初探[J];计算机工程与应用;2000年06期
7 谭义红,林亚平;向量空间模型中完全加权关联规则的挖掘[J];计算机工程与应用;2003年13期
8 谭义红,陈治平,林亚平;一种改进的约束关联规则挖掘算法[J];计算机工程;2004年01期
9 崔立新,苑森淼,赵春喜;约束性相联规则发现方法及算法[J];计算机学报;2000年02期
10 毛国君,刘椿年;基于项目序列集操作的关联规则挖掘算法[J];计算机学报;2002年04期
【共引文献】
中国期刊全文数据库 前10条
1 刘金红,夏阳,陆余良;基于Ontology的网络元数据抽取系统的研究与实现[J];安徽电子信息职业技术学院学报;2004年Z1期
2 窦祥国,胡学钢;关联规则的评价方法研究[J];安徽技术师范学院学报;2005年04期
3 安颖;;基于Apriori算法的兴趣集加权关联规则挖掘[J];北京联合大学学报(自然科学版);2008年04期
4 金玮;张克君;杨炳儒;;一种高效挖掘关联规则的算法研究[J];北京工商大学学报(自然科学版);2006年06期
5 李业丽,陆利坤;数据挖掘在虚拟企业联盟中的应用研究[J];北京印刷学院学报;2004年01期
6 唐培丽;解飞;陈志雨;;基于概念检索的中文搜索引擎研究[J];长春大学学报;2006年04期
7 戴小廷;陈荣思;;数据挖掘在电力系统中的应用[J];重庆科技学院学报(自然科学版);2009年03期
8 席俊杰,胡勇,贾凤国;基于信息挖掘技术的设备前期管理研究[J];成组技术与生产现代化;2003年02期
9 伊卫国;卫金茂;王名扬;;关联规则挖掘方法的改进[J];东北师大学报(自然科学版);2006年02期
10 原福永,李莉,李红岩;智能信息检索的设计与研究[J];燕山大学学报;2005年04期
中国重要会议论文全文数据库 前10条
1 胥永康;岳筱玲;;浅谈网络信息挖掘应用技术[A];第一届全国Web信息系统及其应用会议(WISA2004)论文集[C];2004年
2 栾悉道;谢毓湘;文军;吴玲达;;基于知识库的主动式专题搜索引擎[A];第一届建立和谐人机环境联合学术会议(HHME2005)论文集[C];2005年
3 刘德喜;何炎祥;邢显黎;;基于下钻操作的多层关联规则挖掘算法研究[A];湖北省机械工程学会青年分会2006年年会暨第2届机械学院院长(系主任)会议论文集(下)[C];2006年
4 曲爽;谷文祥;;基于兴趣度和负项集的关联规则挖掘算法的研究[A];2005年全国理论计算机科学学术年会论文集[C];2005年
5 高翔;王敏;;模糊频繁情节挖掘算法在入侵检测中的应用[A];2005年全国开放式分布与并行计算学术会议论文集[C];2005年
6 汤志伟;王菁;;面向公众的电子政务个性化信息服务体系的构建[A];中国信息经济学会2007年学术年会论文集[C];2007年
7 李雪竹;周国祥;;基于本体的语义网技术在信息检索中的研究[A];全国第20届计算机技术与应用学术会议(CACIS·2009)暨全国第1届安全关键技术与应用学术会议论文集(上册)[C];2009年
8 曹玮祺;梁华瑞;朱雷;李涓子;王克宏;;基于半结构化信息模型的信息检索[A];第六届全国计算机应用联合学术会议论文集[C];2002年
9 陶兰;李四明;冯爽;;面向领域的网上信息挖掘系统研究与实现[A];第六届全国计算机应用联合学术会议论文集[C];2002年
10 毛颖;周源远;王继成;;信息过滤技术研究[A];第一届学生计算语言学研讨会论文集[C];2002年
中国博士学位论文全文数据库 前10条
1 李强;数据挖掘中关联分析算法研究[D];哈尔滨工程大学;2010年
2 何因;排序学习中基于直接优化信息检索评价准则算法的理论分析[D];中国科学技术大学;2010年
3 吴羽;面向时间敏感对象的垂直搜索引擎关键技术研究[D];浙江大学;2011年
4 张翔;文本挖掘技术研究及其在综合风险信息网络中的应用[D];西北大学;2011年
5 张晓辉;云理论和数据挖掘在水上安全分析中的应用[D];大连海事大学;2011年
6 由育阳;数据流容错挖掘算法研究[D];哈尔滨工程大学;2011年
7 刘智;关联规则挖掘方法及其在冠心病中医诊疗中的应用研究[D];大连海事大学;2012年
8 胡健;开放式分布协作信息技术[D];电子科技大学;2000年
9 陈燕;数据仓库的设计与实现[D];大连理工大学;2000年
10 高飞;关联规则挖掘算法研究[D];西安电子科技大学;2001年
中国硕士学位论文全文数据库 前10条
1 梅俊;数据挖掘中关联规则算法的研究及应用[D];安徽工程大学;2010年
2 徐财应;基于Lucene的搜索引擎技术的研究与改进[D];长春理工大学;2010年
3 程波波;基于文本的茶学本体学习方法研究[D];安徽农业大学;2010年
4 冯兴祥;关联规则挖掘在高校招生录取中的应用[D];合肥工业大学;2010年
5 艾伟;基于本体的Web信息文本挖掘与检索服务研究[D];北京信息控制研究所;2010年
6 余璟飞;企业信息网用户决策支持系统设计[D];哈尔滨理工大学;2010年
7 程澄;一种舆情数据挖掘平台的研究[D];北京交通大学;2011年
8 李元乾;基于移动搜索用户关联的信息检索研究[D];北京交通大学;2010年
9 周晓红;基于内容与链接的页面价值算法研究[D];电子科技大学;2010年
10 牛亦;基于数据挖掘技术的航班延误DSS研究[D];电子科技大学;2010年
【同被引文献】
中国期刊全文数据库 前10条
1 李源,何清,史忠植;基于概念语义空间的联想检索[J];北京科技大学学报;2001年06期
2 黄美璇;;基于主题发现的舆情分析系统的设计与实现[J];北京联合大学学报(自然科学版);2012年01期
3 蔡瑞平,钟哲辉;搜索引擎的检索功能特征及技巧[J];图书与情报;2003年04期
4 金博,史彦军,滕弘飞;基于语义理解的文本相似度算法[J];大连理工大学学报;2005年02期
5 朱晓华;基于概念空间方法的信息检索技术研究[J];大学图书馆学报;2003年02期
6 林亚平,刘云中,周顺先,陈治平,蔡立军;基于最大熵的隐马尔可夫模型文本信息抽取[J];电子学报;2005年02期
7 雷力;;矩阵加权关联规则挖掘算法研究[J];福建电脑;2006年10期
8 吴绍忠;李淑华;;互联网络舆情预警机制研究[J];中国人民公安大学学报(自然科学版);2008年03期
9 霍林;王力;黄俊文;潘英花;;一种结合同义词典和词对共现距离的查询扩展方法[J];广西大学学报(自然科学版);2010年02期
10 刘馨;;基于小波基函数的语音增强研究[J];华东交通大学学报;2009年05期
中国重要会议论文全文数据库 前1条
1 梅雪;程学旗;郭岩;张刚;丁国栋;;一种全自动生成网页信息抽取Wrapper的方法[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
中国博士学位论文全文数据库 前10条
1 陈劲光;基于云模型的中文面向查询多文档自动文摘研究[D];华中师范大学;2011年
2 李广建;个性化网络信息检索系统的研究与实现[D];中国科学院研究生院(文献情报中心);2002年
3 张毅波;中文结构化信息检索系统的研究与实现[D];中国科学院研究生院(软件研究所);2001年
4 张蕾;概念结构及其应用[D];西北工业大学;2001年
5 王晓东;基于Ontology知识库系统建模与应用研究[D];华东师范大学;2003年
6 张俊林;基于语言模型的信息检索系统研究[D];中国科学院研究生院(软件研究所);2004年
7 王进;基于本体的语义信息检索研究[D];中国科学技术大学;2006年
8 朱海平;基于概念图匹配的语义搜索[D];上海交通大学;2006年
9 缪裕青;关联规则挖掘及其在基因表达数据中的应用[D];中国科学技术大学;2007年
10 史斌;面向语义网的语义搜索引擎关键技术研究[D];北京工业大学;2010年
中国硕士学位论文全文数据库 前10条
1 张红春;中文维基百科的结构化信息抽取及词语相关度计算[D];华中师范大学;2011年
2 闫学亮;信息检索查询词权重分配方法的研究[D];内蒙古大学;2011年
3 周剑烽;基于语义本体的信息检索方法的研究[D];杭州电子科技大学;2010年
4 唐蓉;搜索引擎重复网页检测技术研究[D];重庆理工大学;2011年
5 薛云;Internet上元搜索引擎的研究与设计[D];太原理工大学;2003年
6 胡珍新;面向用户的查询扩展研究与实现[D];江西师范大学;2004年
7 胡陈勇;关于扩展关联规则的若干问题的研究[D];吉林大学;2004年
8 王国琴;基于语义检索的概念空间研究[D];南京理工大学;2004年
9 朱冀;以概念分层为背景知识的关联规则挖掘算法的分析[D];电子科技大学;2004年
10 李辉;基于语义关系的摘要提取[D];南京理工大学;2004年
【二级引证文献】
中国期刊全文数据库 前10条
1 卞咸杰;;基于LINQ技术的数字档案检索研究[J];档案学研究;2012年02期
2 李泽军;;基于矩阵加权关联规则的空间粒度聚类算法[J];电脑知识与技术;2010年02期
3 张达夫;;基于依存关系匹配的长难查询处理[J];电脑知识与技术;2012年19期
4 姚兰;林鸿飞;林原;马云龙;;基于句法特征的冗长查询处理技术[J];北京大学学报(自然科学版);2013年02期
5 邹琼;;信息检索中的查询扩展技术综述[J];计算机光盘软件与应用;2014年08期
6 黄佳来;王立波;袁道敏;;基于语义相似度的查询扩展研究[J];杭州电子科技大学学报;2008年05期
7 黄名选;严小卫;张师超;;基于完全加权关联规则的局部反馈查询扩展[J];计算机工程与应用;2008年07期
8 黄名选;陈燕红;;基于q→t_i和q→﹁t_j挖掘的查询扩展算法[J];计算机工程与应用;2012年09期
9 曾利军;李泽军;柳佳刚;;基于矩阵加权关联规则的区间模糊C均值聚类[J];计算机工程;2010年22期
10 黄名选;冯平;马瑞兴;;基于频繁项集和相关性的局部反馈查询扩展[J];计算机工程;2011年23期
中国重要会议论文全文数据库 前2条
1 郭文;史晓东;陈毅东;;跨语言信息检索中的查询扩展[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
2 黄名选;;基于正负关联规则挖掘的局部反馈查询扩展[A];第六届全国信息检索学术会议论文集[C];2010年
中国博士学位论文全文数据库 前5条
1 陈曦;基于子串的文本分割与主题标注研究[D];武汉大学;2009年
2 万源;基于语义统计分析的网络舆情挖掘技术研究[D];武汉理工大学;2012年
3 王根生;面向群体极化的网络舆情演化研究[D];江西财经大学;2011年
4 王振峰;基于本体的地理事件信息检索[D];武汉大学;2009年
5 张乃静;基于林业科学数据的语义检索研究[D];中国林业科学研究院;2013年
中国硕士学位论文全文数据库 前10条
1 许坤;基于本体的应急信息管理系统的研究与设计[D];郑州大学;2010年
2 孟庆海;基于社会书签的个性化查询词扩展技术研究[D];哈尔滨工程大学;2010年
3 张东;基于语义相似度的地理信息检索技术研究[D];山东农业大学;2011年
4 李芳芳;个人数据空间管理系统中数据抽取及语义关联构建[D];北京交通大学;2011年
5 王畅;基于形式概念分析与关键词加权的用户查询词扩展研究[D];西华大学;2011年
6 李帅;基于语义相似度的查询扩展优化[D];杭州电子科技大学;2011年
7 熊霞;基于叙词表词间关系的领域信息检索[D];中国农业科学院;2011年
8 余伟;基于云计算的分布式搜索技术研究[D];武汉科技大学;2011年
9 王晶;基于领域本体扩展查询的文本信息检索研究[D];东北石油大学;2011年
10 马中杰;基于领域本体的语义检索系统研究[D];安徽大学;2011年
【二级参考文献】
中国期刊全文数据库 前10条
1 王继成,潘金贵,张福炎;Web文本挖掘技术研究[J];计算机研究与发展;2000年05期
2 周欣,沙朝锋,朱扬勇,施伯乐;兴趣度——关联规则的又一个阈值[J];计算机研究与发展;2000年05期
3 寇育敬,王春花,黄厚宽;约束关联规则的增量式维护算法[J];计算机研究与发展;2001年08期
4 邹涛;王继成;杨文清;张福炎;;文本信息检索技术[J];计算机科学;1999年09期
5 程继华,郭建生,施鹏飞;挖掘所关注规则的多策略方法研究[J];计算机学报;2000年01期
6 崔立新,苑森淼,赵春喜;约束性相联规则发现方法及算法[J];计算机学报;2000年02期
7 周斌,吴泉源;序列模式挖掘的一种渐进算法[J];计算机学报;1999年08期
8 冯玉才,冯剑琳;关联规则的增量式更新算法[J];软件学报;1998年04期
9 李水平,陈意云,黄刘生;数据采掘技术回顾[J];小型微型计算机系统;1998年04期
10 张晓辉,邵华,常桂然;WWW上的信息发现与搜索引擎技术[J];小型微型计算机系统;1998年06期
【相似文献】
中国期刊全文数据库 前10条
1 周敏生;企业不可忽视“关联信息”[J];秘书;2000年07期
2 郭轶尊,顾国昌;水下机器人标图中的传感器关联信息处理方法[J];哈尔滨工程大学学报;2003年01期
3 张涛;高海波;李昕;洪文学;;通信网络关联信息可视化[J];燕山大学学报;2010年02期
4 李卓尔;胡运发;;一种对BBS语料进行话题提取的聚类算法[J];计算机应用与软件;2008年08期
5 伊旭;陈广联;金明;叶小绪;;实时/历史数据库技术在500kV变电所的应用[J];浙江电力;2006年06期
6 韩宗芬;陈羚;袁平鹏;刘英书;;基于关联的科技文献检索方法[J];华中科技大学学报(自然科学版);2007年11期
7 周怡;;泛在网络中基于标签标识的应用与业务需求[J];电信网技术;2010年03期
8 庄哲民,张阿妞;基于关联信息的阵列气体传感器故障诊断研究[J];测试技术学报;2005年03期
9 马丽丽;黄宏斌;邓苏;;包含关联的语义覆盖网构建方法研究[J];计算机工程与应用;2009年21期
10 钱剑飞,陈华,陈奇,俞瑞钊;一种代码与中文文档关联信息的自动提取方法[J];浙江大学学报(工学版);2004年11期
中国重要会议论文全文数据库 前10条
1 王玉华;王铭文;;Fuzzy信息源的信息量及关联信息[A];中国系统工程学会模糊数学与模糊系统委员会第五届年会论文选集[C];1990年
2 王耀;陈醒辉;;网架结构通用计算程序[A];第二届空间结构学术交流会论文集(第一卷)[C];1984年
3 索玮岚;冯博;樊治平;;具有不同偏好形式关联信息的项目合作风险因素识别方法[A];中国企业运筹学学术交流大会论文集[C];2008年
4 刘峭;Egil Pedersen;;关于船舶安全运航上的冲突关联信息可视化的认知学上的研究[A];科技、工程与经济社会协调发展——中国科协第五届青年学术年会论文集[C];2004年
5 张树武;徐波;黄泰翼;;汉语大词汇/连续语音识别语言建模技术分析[A];第四届全国人机语音通讯学术会议论文集[C];1996年
6 刘君强;彭智勇;杨先娣;李旭晖;;一个基于对象代理模型的生物信息集成系统[A];2005年全国理论计算机科学学术年会论文集[C];2005年
7 张晓艳;王挺;陈火旺;;基于多向量和实体模糊匹配的话题关联识别[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
8 季浩;李书杰;刘晓平;;规律维的建模与可视化方法研究[A];全国第19届计算机技术与应用(CACIS)学术会议论文集(下册)[C];2008年
9 汤筱贤;;资源管理的转型探讨——系统优化整合资源信息 业务应用推动资源管理[A];2007中国科协年会——通信与信息发展高层论坛论文集[C];2007年
10 周立鹤;谭宽;许云琪;;基于GIS的配网线路管理系统应用研究[A];2008年云南电力技术论坛论文集[C];2008年
中国重要报纸全文数据库 前10条
1 本报记者 石磊;进口家电关税急降 影响微乎其微[N];经济观察报;2007年
2 ;应用映射跟踪IT资产[N];网络世界;2006年
3 张梦谦 陆海青 胡海啸;从关联信息中“挖”出稽查案源[N];中国税务报;2006年
4 吉林省邮电工程有限公司 宁雪峰;自动穿越在VLAN之间[N];中国计算机报;2008年
5 玫懿;“万码奔腾”何所去?[N];中国经济导报;2004年
6 鄢晓夫;监控审核体系 防范银行卡犯罪[N];金融时报;2007年
7 高初建;“万码奔腾”何所去?[N];中华工商时报;2004年
8 ;邮政分拣技术实现革命性的突破[N];人民邮电;2006年
9 ;联想服务与科技共舞[N];计算机世界;2002年
10 北京市银监局 喻强;有效防范 关联交易风险[N];上海金融报;2004年
中国博士学位论文全文数据库 前7条
1 镇璐;基于知识网格的知识供应理论与技术[D];上海交通大学;2008年
2 范霄文;基于粗糙集的定性数据分析方法研究[D];厦门大学;2008年
3 蔡柯柯;基于查询特征上下文的检索模型研究[D];浙江大学;2007年
4 熊焰;运动员竞技能力的参赛变异及其成因与对策[D];北京体育大学;2005年
5 金海松;轿车信息集中控制系统的关键技术研究[D];武汉理工大学;2005年
6 李宏博;高频雷达目标数据处理技术研究[D];哈尔滨工业大学;2009年
7 胡红革;网络化控制系统Petri网建模与分析[D];电子科技大学;2005年
中国硕士学位论文全文数据库 前10条
1 马麟;关联理论对于模糊修辞翻译的诠释[D];广东外语外贸大学;2006年
2 王海燕;顺应—关联模式在跨文化交际中的应用[D];中国石油大学;2007年
3 陈羚;基于语义的文献关联信息浏览系统[D];华中科技大学;2007年
4 梁波;基于本体的概念建模可视化认知支持[D];国防科学技术大学;2008年
5 顾怡坤;基于组件与终端输出关系的诊断求解[D];吉林大学;2010年
6 李永强;基于光子轨道角动量纠缠的压缩关联成像研究[D];南京邮电大学;2013年
7 吴学良;企业级Web报表的研究与实现[D];北京交通大学;2008年
8 刘杰伟;关联理论与大学英语阅读理解教学[D];西南大学;2008年
9 吴晓佳;WLAN频谱导航系统验证帧处理模块和快速关联模块的分析与设计[D];北京邮电大学;2013年
10 宁静;关联理论与大学英语阅读教学[D];广西师范大学;2006年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026