收藏本站
《中南大学》 2004年
收藏 | 手机打开
二维码
手机客户端打开本文

基于本体的Web页面分类挖掘

马征  
【摘要】:Web是一个巨大的、广泛分布的全球化信息仓库,它提供了新闻、财经、广告、商务、文化、教育等多方面的信息服务。如何有效地帮助用户从Web上发现他们感兴趣的资源,已经成为一个迫切需要解决的课题。 论文首先介绍了Web挖掘的一些基本概念、方法和技术,阐述了什么是Web挖掘,为什么要进行挖掘。研究了基于主题特征词和统计学知识的Web页面分类挖掘的一般过程和方法。作者针对一个已有的系统进行分析,指出了该方法的局限性——在学习阶段对于训练集依赖性大,导致在训练集不足的情形下分类的精度不高。 针对基于主题特征词和统计学知识的Web页面分类挖掘的缺陷提出了基于本体的Web页面分类挖掘模型。该模型利用本体来表述已有知识,在此基础上对解析后的页面采用多种匹配方法进行信息抽取,并结合三个算法来计算页面与本体的相关度,来提高相关度计算的正确性,建立更为有效的分类规则,以力求提高分类的精度。 建立了一个基于本体的Web页面分类挖掘原型系统,通过实验表明,这种基于本体的方法确实能够在训练集数量较小的情况下,得到较高的分类精度。同时也与原有的系统进行了对比性实验,确实证明了该方法的在训练集较小的情形下,比基于主题特征词方法的能够有更好的精度。 最后对本文的工作进行了总结,并确定了进一步研究方向。
【学位授予单位】:中南大学
【学位级别】:硕士
【学位授予年份】:2004
【分类号】:TP393.092

【相似文献】
中国期刊全文数据库 前10条
1 杨兰娟;;基于本体的Web挖掘在个性化E-learning系统中的应用[J];电脑知识与技术;2010年07期
2 伏晓;骆斌;陈世福;;基于语义的Web挖掘[J];计算机科学;2005年03期
3 李恒杰;李明;;基于本体的Web分类技术研究[J];微计算机信息;2006年21期
4 王涛伟;任一波;;基于多Agent的语义Web挖掘系统模型研究[J];浙江万里学院学报;2006年05期
5 左鹏,徐和龙,于国庆;Web挖掘在FDSS中的应用探讨[J];计算机与现代化;2001年05期
6 汪全莉;陈代春;;Web数据挖掘在网络教育中的应用[J];中国科技资源导刊;2008年02期
7 陈建华,包煊;Web挖掘系统的设计与实现[J];计算机工程;2002年08期
8 易高翔,程耕国;数据挖掘在Web智能化中应用研究[J];计算机工程与设计;2005年01期
9 陈振,郑诚,朱小栋;一种基于关联分类方法的Web用户兴趣预测[J];微机发展;2005年05期
10 汪全莉;陈代春;;Web挖掘在网络教育中的应用研究[J];大学图书情报学刊;2008年03期
中国重要会议论文全文数据库 前10条
1 赵泽宗;;比喻推理建构[A];逻辑今探——中国逻辑学会第五次代表大会暨学术讨论会论文集[C];1996年
2 戴佐培;宋春林;李净;;基于本体的中医经络知识库的设计与开发[A];2008年中国高校通信类院系学术研讨会论文集(上册)[C];2009年
3 伍伟;李兵;曾诚;;基于本体的语义Web服务注册平台研究[A];2008年全国开放式分布与并行计算机学术会议论文集(下册)[C];2008年
4 陈冬菊;张发军;宫玉梅;何天白;;在嵌段共聚物本体与薄膜中结晶形貌的研究[A];2005年全国高分子学术论文报告会论文摘要集[C];2005年
5 广凯;魏鲲;金浩;潘金贵;;一种基于本体的上下文模型[A];第二届和谐人机环境联合学术会议(HHME2006)——第2届中国普适计算学术会议(PCC'06)论文集[C];2006年
6 康达周;徐宝文;陆建江;李言辉;;支持语义web模糊本体的描述逻辑(英文)[A];全国语域web与本体能研讨会论文集[C];2006年
7 罗娜;左万利;袁福宇;张靖波;张慧杰;;使用本体语义提高文本聚类(英文)[A];全国语域web与本体能研讨会论文集[C];2006年
8 颜端武;李晓鹏;王磊;成晓;;文本聚类中基于本体的相似性测度(英文)[A];全国语域web与本体能研讨会论文集[C];2006年
9 蔡畅;李宏伟;李勤超;;语义层次的知识推理研究[A];中国地理信息系统协会第四次会员代表大会暨第十一届年会论文集[C];2007年
10 王肃;杜军平;高田;;基于本体与知识背景的模式挖掘框架研究[A];2009年中国智能自动化会议论文集(第二分册)[C];2009年
中国重要报纸全文数据库 前10条
1 黄家艳;川电三公司汽机工程处本体班获“全国质量信得过班组”[N];西南电力报;2002年
2 刘春田;“知识”的本体和现实形态[N];中国知识产权报;2004年
3 中国科学院计算技术研究所 黄瑞史忠植;加强知识的共享与重用[N];计算机世界;2007年
4 大江;锻造本体竞争力[N];中国改革报;2006年
5 深圳报业集团驻京记者 陆云红;改革开放之窗创新活力之都[N];深圳特区报;2006年
6 任玉岭;一本体现时代精神的哲学教材[N];光明日报;2003年
7 郑敏;也谈本体杂文[N];中国文化报;2003年
8 宏图三胞高级副总裁 花贵侃;企业需要一条灵活的“尾巴”[N];电脑商报;2007年
9 左孝 记者蒋寒;世界最大本体装置在天原建成[N];科技日报;2005年
10 孙国华;法的本体是法律关系[N];检察日报;2005年
中国博士学位论文全文数据库 前10条
1 杜文华;本体的构建及其在数字图书馆中的应用研究[D];武汉大学;2005年
2 安杨;基于本体的网络地理服务中的关键问题研究[D];武汉大学;2005年
3 严亚兰;基于语义Web的知识处理研究[D];武汉大学;2005年
4 罗正鸿;D_4/APAEDMS本体开环共聚及其数学模拟[D];浙江大学;2003年
5 易明;基于Web挖掘的电子商务个性化推荐机理与方法研究[D];华中科技大学;2006年
6 周明建;基于本体的开放式知识管理研究[D];浙江大学;2004年
7 李景;本体理论及在农业文献检索系统中的应用研究——以花卉学本体建模为例[D];中国科学院研究生院(文献情报中心);2004年
8 袁方;面向智能信息检索的Web挖掘关键技术研究[D];东北大学;2006年
9 胡鹤;本体方法及其时空推理应用研究[D];吉林大学;2004年
10 王真星;基于本体的计算机支持协同学习关键技术研究[D];复旦大学;2003年
中国硕士学位论文全文数据库 前10条
1 马征;基于本体的Web页面分类挖掘[D];中南大学;2004年
2 蒲秋梅;基于XML的Web数据挖掘技术的研究[D];武汉大学;2004年
3 孙丽;Web数据的挖掘方法研究[D];大庆石油学院;2004年
4 黄荣兵;RBF神经网络在Web挖掘中的应用研究[D];太原理工大学;2004年
5 易高翔;Web文本挖掘研究与实现[D];武汉科技大学;2004年
6 谢振亮;基于WEB挖掘技术的网页自动分类和聚类的研究[D];天津大学;2004年
7 张承明;基于Web的数据挖掘研究[D];山东科技大学;2003年
8 段晓峰;网站日志的数据挖掘[D];重庆大学;2003年
9 牟刚;基于XML的Web信息挖掘技术的研究[D];重庆大学;2004年
10 唐飞龙;Internet信息获取技术的研究[D];合肥工业大学;2002年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026