收藏本站
《重庆大学》 2004年
收藏 | 手机打开
二维码
手机客户端打开本文

基于XML的Web信息挖掘技术的研究

牟刚  
【摘要】:如何让Internet更好地为人类服务,是未来的一个真正挑战。一方面是人们对快速、准确而全面获取信息的渴望,而另一方面却是Internet上信息的纷繁芜杂,在着两者之间假设一座桥梁的确是一个巨大的挑战。作为从浩瀚的Web信息资源中发现潜在的有价值知识的一种有效技术,Web挖掘正悄然兴起,倍受关注。 本文对Web挖掘的有关理论进行了论述,着重讨论了Web内容挖掘系统的结构和技术。本文的主要内容包括: 一、介绍了数据挖掘技术和Web挖掘技术。 二、描述了Web内容挖掘系统的构建,包括Web的数据模型,体系结构,系统功能等; 三、介绍了XML的产生的背景、特点以及有介绍了XML的相关规范; 四、针对基于XML的Web内容挖掘提出了一个挖掘模型和数据抽取方法。 五、针对基于XML在Web内容挖掘中的运用,进行了相关的实验并详细地介绍和说明了XML在Web内容挖掘的具体实现过程。
【学位授予单位】:重庆大学
【学位级别】:硕士
【学位授予年份】:2004
【分类号】:TP311.13

【参考文献】
中国期刊全文数据库 前10条
1 范亚芹,刘颖,李兴男;Web数据挖掘原理及实现[J];吉林大学学报(信息科学版);2003年04期
2 万方,尹为民,吴迪;网络数据挖掘及其新技术探讨[J];信息技术;2002年01期
3 王颖楠,滕飞,解莉,孙俏;Web挖掘技术[J];吉林工学院学报(自然科学版);2002年01期
4 邓英,李明;Web数据挖掘技术及工具研究[J];计算机工程与应用;2001年20期
5 周杰韩,曾庆良,谢金崇,熊光楞;基于XML的互连网信息资源描述及其应用研究[J];计算机工程与应用;2002年03期
6 谭汉松,李红;基于信息过滤后的Web内容挖掘[J];计算机工程与应用;2003年30期
7 吴敏,徐德智;XML数据的存储实现研究[J];计算机工程;2003年15期
8 蔡晓睿;XML技术及其在未来网络中的应用[J];情报科学;2003年06期
9 邹涛,黄源,张福炎;基于WWW的文本信息挖掘[J];情报学报;1999年04期
10 石建,孔祥成,苏春萍;论个性化信息提取中的Web挖掘技术[J];情报杂志;2003年02期
【共引文献】
中国期刊全文数据库 前10条
1 李长江;;基于web的数据挖掘技术的应用研究[J];才智;2009年10期
2 谷兰英,王明常;多元地学信息系统的设计与实现[J];吉林大学学报(地球科学版);2005年S1期
3 洪梅;;Web日志挖掘在电子商务中的应用[J];长春大学学报;2008年10期
4 朱良,谈香如;一种用决策树对XML文档进行分类的方法[J];长沙电力学院学报(自然科学版);2004年02期
5 王志明;沙莎;;Web文本挖掘技术在新闻主题检测中的应用研究[J];长沙大学学报;2007年05期
6 彭英;KDW新技术探讨[J];长沙通信职业技术学院学报;2004年02期
7 张骏;史振华;白丽晗;;基于.NET的Web结构挖掘技术研究及应用[J];电脑编程技巧与维护;2009年04期
8 范建中;王福庆;;基于Web的数据挖掘技术研究与应用[J];电脑编程技巧与维护;2009年12期
9 欧歌,赵恒永;一种专题Web信息采集系统的设计方案[J];电脑与信息技术;2004年06期
10 关冰核;基于XML的WEB数据挖掘技术系统框架的设计[J];电脑知识与技术;2004年23期
中国重要会议论文全文数据库 前8条
1 滕明鑫;高占国;杨秀清;;数据挖掘中决策树算法优化研究[A];2006北京地区高校研究生学术交流会——通信与信息技术会议论文集(下)[C];2006年
2 阮鸣梁;陈维默;;数据挖掘技术的发展与应用[A];福建省科协第五届学术年会数字化制造及其它先进制造技术专题学术年会论文集[C];2005年
3 万英;蒋梁中;翟敬梅;;虚拟数据库与WEB数据挖掘[A];首届泛珠三角先进制造技术论坛暨第八届粤港机电工程技术与应用研讨会论文专辑[C];2004年
4 曹红;袁津生;;多领域主题搜索引擎研究[A];第一届全国Web信息系统及其应用会议(WISA2004)论文集[C];2004年
5 侯腾飞;;数据仓库、数据挖掘及图书馆信息资源服务[A];山东省图书馆学会第十二次科学讨论会论文集[C];2005年
6 王丙战;吉晓民;董仲元;;ASP服务中的制造资源描述与配置技术研究[A];制造技术自动化学术会议论文集[C];2002年
7 魏新;廖闻剑;彭艳兵;;基于数据挖掘的校园网络行为分析[A];第十届中国科协年会信息化与社会发展学术讨论会分会场论文集[C];2008年
8 赵燕平;李超;;网络安全信息挖掘中的特征选择与专利分析研究[A];2004年中国管理科学学术会议论文集[C];2004年
中国博士学位论文全文数据库 前10条
1 赵有;六西格玛设计中顾客需求分析关键技术研究[D];天津大学;2007年
2 姚倡锋;复杂零件异地协同制造资源优化配置技术研究[D];西北工业大学;2006年
3 马辉;产品设计知识建模与演化关键技术研究[D];浙江大学;2006年
4 戴敏;多工序制造过程质量分析方法与信息集成技术研究[D];东南大学;2006年
5 许增福;DL环境下的信息资源管理及知识发现研究[D];哈尔滨工程大学;2005年
6 孙丽;工艺知识管理及其若干关键技术研究[D];大连交通大学;2005年
7 齐建军;基于XML的制造过程集成框架的研究与实现[D];北京航空航天大学;2005年
8 谢学敏;基于动态流通语料库(DCC)的流行语释义信息自动提取研究[D];北京语言大学;2006年
9 刘怀亮;基于Web Services的网络化制造若干关键技术研究[D];西安电子科技大学;2003年
10 郭秀娟;基于关联规则数据挖掘算法的研究[D];吉林大学;2004年
中国硕士学位论文全文数据库 前10条
1 赵娜;用Microformats对信息管理工具Blog进行语义扩展研究[D];首都师范大学;2009年
2 曾立胜;教学资源的元数据表示及自然语义查询[D];电子科技大学;2008年
3 程杨;基于概念层次树的XML数据挖掘研究[D];华中师范大学;2009年
4 王凯宏;基于.NET专升本招生管理系统的研究与实现[D];电子科技大学;2008年
5 翟晓华;中文信息的语义数据挖掘技术研究[D];湖南大学;2008年
6 徐家宁;基于免疫网络的文本挖掘方法研究[D];长沙理工大学;2008年
7 刘军;基于Web结构挖掘的HITS算法研究[D];中南大学;2008年
8 张亦辉;基于Web的文本挖掘研究[D];山东大学;2008年
9 朱红祥;基于web日志数据挖掘的电子商务推荐系统实现[D];山东大学;2008年
10 徐坤;基于关系数据库搜索引擎的研究[D];长春理工大学;2008年
【二级参考文献】
中国期刊全文数据库 前10条
1 宋伟,王举成,马根峰,赵济林;Internet数据挖掘原理及实现[J];重庆邮电学院学报(自然科学版);2001年02期
2 张晋,陈立潮,田容;未来基于Web的通用数据格式——XML[J];华北工学院学报;2001年02期
3 ;计算机科学丛书[J];计算机研究与发展;2000年04期
4 王继成,潘金贵,张福炎;Web文本挖掘技术研究[J];计算机研究与发展;2000年05期
5 韩家炜,孟小峰,王静,李盛恩;Web挖掘研究[J];计算机研究与发展;2001年04期
6 阳小华;Web站点的超链结构挖掘[J];计算机工程与应用;2001年08期
7 李岩,陈新中,杨炳儒;基于Web挖掘的智能门户搜索引擎的研究[J];计算机工程与应用;2002年04期
8 朱廷劭;高文;;KDD:数据库中的知识发现[J];计算机科学;1997年06期
9 陈恩红;范焱;王行甫;蔡庆生;;网际网上半结构化数据抽取与知识发现方法及其实现[J];计算机科学;1999年10期
10 沈达阳;孙茂松;;万维网知识挖掘方法的研究[J];计算机科学;2000年02期
【相似文献】
中国期刊全文数据库 前10条
1 朱丽红,赵燕平;Web挖掘研究综述[J];情报杂志;2004年07期
2 谭汉松,李红;基于信息过滤后的Web内容挖掘[J];计算机工程与应用;2003年30期
3 涂承胜,鲁明羽,陆玉昌;Web挖掘研究综述[J];计算机工程与应用;2003年10期
4 顾晓燕;关于Web挖掘技术的研究[J];电脑知识与技术;2005年02期
5 蒋良孝,蔡之华;Web挖掘及其应用研究[J];现代计算机;2003年03期
6 高宏,朱耀稷;广义Web内容挖掘模型算法[J];天津理工学院学报;2005年02期
7 张小松,窦炳琳;Web挖掘研究[J];唐山学院学报;2003年04期
8 谭营军,李翠霞;Web使用记录挖掘的研究[J];洛阳大学学报;2005年02期
9 涂承胜,鲁明羽,陆玉昌;Web内容挖掘技术研究[J];计算机应用研究;2003年11期
10 李亚飞,刘业政;Web挖掘的体系研究[J];合肥工业大学学报(自然科学版);2004年03期
中国重要会议论文全文数据库 前10条
1 丁瑾;;基于Web数据挖掘的综述[A];山西省科学技术情报学会学术年会论文集[C];2004年
2 董燕;;Web挖掘对电子商务网站建设的影响[A];第11届海峡两岸信息管理发展策略研讨会论文集[C];2005年
3 易虹;许德刚;;Web数据挖掘的研究与应用[A];第一届全国Web信息系统及其应用会议(WISA2004)论文集[C];2004年
4 宋江春;沈钧毅;;基于CORBA的分布式Web挖掘系统的设计与实现[A];2005年全国开放式分布与并行计算学术会议论文集[C];2005年
5 王磊;王丰辉;郑康锋;杨义先;;基于Web挖掘技术的漏洞收集系统研究与设计[A];2006北京地区高校研究生学术交流会——通信与信息技术会议论文集(下)[C];2006年
6 林政;吕雅娟;刘群;马希荣;;基于双语混和网页的平行语料挖掘[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
7 栾悉道;谢毓湘;文军;吴玲达;;基于知识库的主动式专题搜索引擎[A];第一届建立和谐人机环境联合学术会议(HHME2005)论文集[C];2005年
8 汪洋;张磊;章毅;;基于短语匹配的中文Web文档聚类算法[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年
9 钟福金;穆斌;;语义Web挖掘研究[A];第一届全国Web信息系统及其应用会议(WISA2004)论文集[C];2004年
10 于满泉;谭松波;许洪波;;网页内部结构挖掘技术研究[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
中国重要报纸全文数据库 前4条
1 王培森;从Web挖到竞争情报[N];中国计算机报;2003年
2 涂序彦 陈泓娟;在网络信息海洋中淘金[N];计算机世界;2001年
3 ;Web收获:吸纳有用信息[N];计算机世界;2004年
4 张德政;信息挖掘商业智能之“芯”[N];中国计算机报;2002年
中国博士学位论文全文数据库 前7条
1 孙建涛;Web挖掘中的降维和分类方法研究[D];清华大学;2005年
2 张友华;面向智能服务的Web内容计算研究与应用[D];中国科学技术大学;2006年
3 阮备军;Web使用挖掘若干关键问题研究[D];复旦大学;2004年
4 何丽;基于Web挖掘的决策支持系统模型研究[D];天津大学;2005年
5 袁方;面向智能信息检索的Web挖掘关键技术研究[D];东北大学;2006年
6 孙舒杨;统计关系学习的若干问题研究[D];吉林大学;2006年
7 邓爱林;电子商务推荐系统关键技术研究[D];复旦大学;2003年
中国硕士学位论文全文数据库 前10条
1 牟刚;基于XML的Web信息挖掘技术的研究[D];重庆大学;2004年
2 王维花;WEB挖掘研究和基于多层次数据库的智能化WEB挖掘引擎系统的实现[D];西安理工大学;2004年
3 王石;基于XML的Web挖掘[D];东北师范大学;2005年
4 冶红;基于数据挖掘的Web挖掘系统的研究[D];大连理工大学;2003年
5 李晓;Web挖掘技术[D];河海大学;2001年
6 高晓琳;网络书签服务系统与Web挖掘技术应用[D];大连理工大学;2002年
7 付曙光;合作伙伴的Web挖掘系统研究[D];辽宁工程技术大学;2005年
8 刘洋;基于Web的内容挖掘技术研究[D];哈尔滨工程大学;2003年
9 钱小军;Web文本挖掘技术研究及其实现[D];浙江大学;2002年
10 易高翔;Web文本挖掘研究与实现[D];武汉科技大学;2004年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026