收藏本站
《西安理工大学》 2004年
收藏 | 手机打开
二维码
手机客户端打开本文

WEB挖掘研究和基于多层次数据库的智能化WEB挖掘引擎系统的实现

王维花  
【摘要】: 论文首先介绍了WEB挖掘和信息检索的概念、相关技术以及国内外发展现状与趋势,描述了现今常用的WEB挖掘方法和工具,提出并实现了基于WEB挖掘和多层次数据库的综合智能化WEB挖掘引擎系统—IWMES(Intelligent WEB Mining Engine System)。该系统通过Web Services技术,建立在现有搜索引擎基础之上,以XML技术解决了多样性和非结构性的WEB数据转换,形成了WEB多层次数据库,利用了WEB挖掘面向结构化或半结构化数据的智能化数据抽取和知识发现过程,并且构造了数据仓库的高性能查询体系结构—HPQS,利用MIDAS技术形成了高性能索引库结构,弥补了当前搜索引擎在覆盖范围、准确率、复杂查询语言的使用和结果表现方式等方面的不足,改善了信息检索的效率。 本文阐述了系统的体系结构,说明了索引库、WEB多层次数据库、数据仓库、数据收集器、数据预处理器和综合数据挖掘器等组成部分的基本功能。并且详细介绍了该系统的实现原理、系统构架以及索引库、WEB信息资源搜索、多层次数据库、数据仓库、数据预处理和数据挖掘等功能模块的构建,并结合模块的功能实现流程图,陈述了整个系统的实现过程。尤其详细介绍了在系统中所使用的数据仓库模块的设计、实施以及OWB软件体系结构的实现,并给出了相应的软件流程图、模块功能结构图、实现方法和部分程序代码,以及系统实现过程中所用到的部分算法。
【学位授予单位】:西安理工大学
【学位级别】:硕士
【学位授予年份】:2004
【分类号】:TP393.09

【引证文献】
中国硕士学位论文全文数据库 前1条
1 郭峰;面向行业搜索引擎的WEB文本挖掘技术研究[D];兰州大学;2006年
【参考文献】
中国期刊全文数据库 前10条
1 宋伟,王举成,马根峰,赵济林;Internet数据挖掘原理及实现[J];重庆邮电学院学报(自然科学版);2001年02期
2 吴果;Web搜索引擎的现状分析[J];河南纺织高等专科学校学报;2001年02期
3 王继成,潘金贵,张福炎;Web文本挖掘技术研究[J];计算机研究与发展;2000年05期
4 周斌,吴泉源,高洪奎;用户访问模式数据挖掘的模型与算法研究[J];计算机研究与发展;1999年07期
5 李蕾,王楠,张剑,钟义信,郭祥昊,贾自燕;中文搜索引擎概念检索初探[J];计算机工程与应用;2000年06期
6 解冲锋,李星;并行式Meta Search系统的设计与实现[J];计算机工程与应用;1999年02期
7 陆伟;吴朝晖;;知识发现方法的比较研究[J];计算机科学;2000年03期
8 刁倩,张惠惠,王永成;Internet上的英文搜索引擎[J];计算机工程;1999年07期
9 邓伟,张志伟,谭庆平,宁洪;一种新型的智能搜索引擎[J];计算机工程;2000年03期
10 杨光,张雷,艾波;数据仓库及联机分析处理技术[J];计算机工程与科学;2000年01期
【共引文献】
中国期刊全文数据库 前10条
1 钱立三;WEB日志挖掘在远程开放教育中的应用[J];安徽广播电视大学学报;2005年03期
2 钟晓旭;胡学钢;;基于数据挖掘的Web招聘信息相关性分析[J];安徽建筑工业学院学报(自然科学版);2010年04期
3 廖亚莉,王锡钢,战学刚;基于关联规则的网站个性化服务[J];鞍山科技大学学报;2004年06期
4 武旭,须德;基于向量空间模型的文本自动分类系统的研究与实现[J];北方交通大学学报;2003年02期
5 胡健;杨炳儒;宋泽锋;钱榕;;基于非结构化数据挖掘结构模型的Web文本聚类算法[J];北京科技大学学报;2008年02期
6 暴海龙,李金林;专利检索中的IPC和主题词识别方法研究[J];北京理工大学学报(社会科学版);2003年05期
7 孙晓,邱显焱;基于分布式网络化的包装生产线设计研究[J];包装工程;2004年06期
8 周海斌;;基于人工蚁群的Web会话聚类[J];重庆邮电学院学报(自然科学版);2006年05期
9 谢秋华;;Web文本挖掘的相关技术问题探讨[J];长春理工大学学报;2010年07期
10 贾丙静;吴长勤;葛华;;Web文本聚类的研究与实现[J];长春师范学院学报;2011年06期
中国重要会议论文全文数据库 前10条
1 代广珍;徐超;;基于Web的数据挖掘研究综述[A];2005年“数字安徽”博士科技论坛论文集[C];2005年
2 雷育生;甘仞初;杨军;;一种基于用户偏好的虚拟网站信息结构自适应调整算法[A];2007年全国第十一届企业信息化与工业工程学术会议论文集[C];2007年
3 陈震;陈维默;;浅谈数据挖掘技术[A];福建省科协第五届学术年会数字化制造及其它先进制造技术专题学术年会论文集[C];2005年
4 祖巧红;陈定方;胡吉全;;分析型客户关系管理系统的研究[A];2005年十二省区市机械工程学会学术年会论文集(湖北专集)[C];2005年
5 蒋子海;周斌;吴泉源;;基于UIMA AS的文本挖掘系统的性能分析与评估[A];全国计算机安全学术交流会论文集·第二十五卷[C];2010年
6 王丹;蔡红柳;王斌;;基于混沌序列的数字水印算法[A];第一届中国高校通信类院系学术研讨会论文集[C];2007年
7 孙丽华;肖诗斌;施水才;;基于向量空间模型的规则分类技术[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
8 张永;陈思睿;杨志勇;;一种改进的文本分类方法的研究[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年
9 曹钰;李涛;张文俊;徐宗昌;;基于DW+OLAP的装备器材保障决策支持系统[A];第二十届全国数据库学术会议论文集(技术报告篇)[C];2003年
10 付延强;韩慧健;;HHME:基于形式概念分析的中文FAQ问答系统[A];第八届和谐人机环境联合学术会议(HHME2012)论文集NCMT[C];2012年
中国博士学位论文全文数据库 前10条
1 牟向伟;模糊语义个性化推荐系统在电子政务中的应用研究[D];大连海事大学;2010年
2 沈巍;建立股指波动预测模型的方法研究及应用[D];华北电力大学(北京);2011年
3 熊回香;面向Web3.0的大众分类研究[D];华中师范大学;2011年
4 杨瑞龙;基于短语特征的Web文档聚类方法研究[D];重庆大学;2010年
5 代劲;云模型在文本挖掘应用中的关键问题研究[D];重庆大学;2011年
6 黄水清;非相关文献知识发现方法及在农业经济学中的应用[D];南京农业大学;2010年
7 张智雄;Internet科技信息资源门户网站(STIP)系统的实践研究[D];中国科学院文献情报中心;2000年
8 陈燕;数据仓库的设计与实现[D];大连理工大学;2000年
9 关志伟;面向用户意图的智能人机交互[D];中国科学院软件研究所;2001年
10 李广建;个性化网络信息检索系统的研究与实现[D];中国科学院研究生院(文献情报中心);2002年
中国硕士学位论文全文数据库 前10条
1 吕晨;搜索竞价广告关键词优化问题研究[D];山东科技大学;2010年
2 范丹;Web检索中的查询扩展及结果聚类技术研究[D];辽宁师范大学;2010年
3 蔡浩;基于Web使用挖掘的协同过滤推荐算法研究[D];浙江理工大学;2010年
4 刘建东;基于Web访问信息挖掘的数字图书馆个性化服务研究[D];浙江理工大学;2010年
5 孙原;基于酉变换的权威页面挖掘算法研究[D];哈尔滨工程大学;2010年
6 高龙;天津港数据集成平台关键技术应用研究[D];大连海事大学;2010年
7 程淑玉;基于协同过滤算法的个性化推荐系统的研究[D];合肥工业大学;2010年
8 张峰;基于数据挖掘技术的教学管理应用研究[D];合肥工业大学;2010年
9 钟晓旭;基于Web招聘信息的文本挖掘系统研究[D];合肥工业大学;2010年
10 方少卿;Web就业信息抽取系统的实现研究[D];合肥工业大学;2010年
【同被引文献】
中国硕士学位论文全文数据库 前10条
1 陈小宁;Web信息资源获取技术的研究与实现[D];暨南大学;2001年
2 冶红;基于数据挖掘的Web挖掘系统的研究[D];大连理工大学;2003年
3 李钝;基于粗糙集理论的文本挖掘技术研究[D];山西大学;2003年
4 谢振亮;基于WEB挖掘技术的网页自动分类和聚类的研究[D];天津大学;2004年
5 徐爱华;面向文本分类的中文文本挖掘技术研究及实现[D];武汉理工大学;2004年
6 易高翔;Web文本挖掘研究与实现[D];武汉科技大学;2004年
7 田红;表格信息抽取引擎的设计与实现[D];西北师范大学;2004年
8 刘岩;基于Web的文本挖掘技术的研究[D];哈尔滨工程大学;2004年
9 徐华;基于支持向量机的Web文本挖掘研究[D];哈尔滨工程大学;2004年
10 李跃进;基于Internet的信息抽取技术研究[D];大连理工大学;2005年
【二级参考文献】
中国期刊全文数据库 前10条
1 王珏;Rough Set约简与数据浓缩[J];高技术通讯;1997年11期
2 汪晓岩,胡庆生,李斌,庄镇泉;面向Internet的个性化智能信息检索[J];计算机研究与发展;1999年09期
3 王继成,邹涛,杨小江,潘金贵,张福炎;基于Internet的信息资源发现技术与实现[J];计算机研究与发展;1999年11期
4 王继成,萧嵘,孙正兴,张福炎;Web信息检索研究进展[J];计算机研究与发展;2001年02期
5 孟卫一,吴宗寰;集成搜索引擎的文本数据库选择[J];计算机研究与发展;2001年04期
6 韩家炜,孟小峰,王静,李盛恩;Web挖掘研究[J];计算机研究与发展;2001年04期
7 周斌,吴泉源,高洪奎;用户访问模式数据挖掘的模型与算法研究[J];计算机研究与发展;1999年07期
8 周会平;王挺;史晓东;陈火旺;齐璇;;一个基于中间语言的汉英机器翻译系统[J];计算机科学;1998年05期
9 刘瑞虹;曹东启;;基于Intranet的Web信息获取方法和实现[J];计算机科学;1999年01期
10 陈宁;周龙骧;;数据采掘在Internet中的应用[J];计算机科学;1999年07期
【相似文献】
中国期刊全文数据库 前10条
1 谢江宏,周命德;BECOS 10 PLUS软件分析研究及开发应用[J];山西电力技术;1995年02期
2 倪燕;;混合数据库悄然来临[J];软件世界;2007年07期
3 李耀辉,刘保军;基于Hash散列分布的数字信息并行存贮[J];燕山大学学报;2004年01期
4 欧阳璟;;IBM DB2 9探索之旅[J];程序员;2006年09期
5 G.A.Champine;张茂绩;;数据库系统的最新趋势[J];计算机科学;1981年01期
6 王翔;;SQL Azure变为付费服务[J];程序员;2010年02期
7 刘德儿,陶智翔;GML数据存储技术的研究与实现[J];国土资源信息化;2005年03期
8 范根定;;用户把Pervasive引进中国 嵌入式数据库有处买[J];每周电脑报;1998年09期
9 敏捷;;DB2:软件智慧“芯”[J];软件世界;2009年08期
10 葛寒松;;三种常用数据模型比较[J];福建电脑;2006年01期
中国重要会议论文全文数据库 前6条
1 张天冲;;计算机函授教学管理系统[A];'92对外经济贸易大学学术报告会论文集[C];1992年
2 刘正涛;毛宇光;吴庄;;一种新的流数据模型及其扩展[A];第二十二届中国数据库学术会议论文集(技术报告篇)[C];2005年
3 刘正涛;毛宇光;吴庄;;持续SPJ查询的有界内存可计算性研究[A];第二十二届中国数据库学术会议论文集(研究报告篇)[C];2005年
4 刘烨;郑怀远;;松散结构的异构数据库集成技术的研究[A];第十届全国数据库学术会议论文集[C];1992年
5 杜鹢;宋自林;;虚拟数据仓库的研究与应用[A];第十五届全国数据库学术会议论文集[C];1998年
6 张大洋;;计算机信息系统建设中的若干问题[A];第十一届全国数据库学术会议论文集[C];1993年
中国重要报纸全文数据库 前8条
1 谢涛;发布DB2V9.0 IBM全面支持XML[N];电脑商报;2006年
2 石竹;非主流数据库的兴衰荣辱[N];计算机世界;2004年
3 本报记者 田梦;XML突破电子病历技术瓶颈[N];计算机世界;2007年
4 ;浅谈数据库系统[N];电脑报;2004年
5 石竹;关系数据库独霸二十多年[N];计算机世界;2004年
6 记者 孙龙;整合科研信息 提高科研效率[N];中国社会科学院院报;2006年
7 郝峥嵘;发力大型机培训助力欧美外包市场[N];中国计算机报;2006年
8 康翔;数据库的XML时代[N];计算机世界;2006年
中国硕士学位论文全文数据库 前10条
1 何立平;基于Java EE应用集成技术的中小模具企业PDM系统的研究[D];大连理工大学;2009年
2 穆成科;基于广义模块化的金属门窗CAD系统研究与应用[D];重庆大学;2009年
3 谭振;信息项目监理系统中访问控制模型的设计与实现[D];湖南大学;2009年
4 张吴波;批量工艺卡网络管理系统的开发与研究[D];武汉科技大学;2004年
5 胡首锋;基于XML技术的系统整合解决方案的应用研究[D];浙江大学;2003年
6 魏先敏;基于多粒度访问控制的密级标识系统的设计与实现[D];电子科技大学;2010年
7 丛学斌;基于云形态数据中心的设计及数据访问的实现[D];吉林大学;2012年
8 王兴昭;基于救助船舶模拟器的视景系统研究[D];大连海事大学;2012年
9 杨继业;三层体系结构数据仓库的工程化研究[D];上海海运学院;2002年
10 由东友;SQL Server考核自动阅卷系统设计与实现[D];吉林大学;2012年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026