收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于多特征融合的网页对象自动定位技术研究

任昌  
【摘要】:网页对象定位技术是实现网页信息抽取的一项关键技术。该技术能够自动地、准确地找到网页中有价值的信息所对应的网页对象。在此基础上,进行数据抽取就变得非常容易了。所以,该技术在网络数据挖掘、垂直搜索和搜索引擎等领域都是一个非常基础的关键性技术。 本文提出了一种基于多特征融合的网页对象定位方法。该方法通过有机融合多种网页对象定位方法,实现了网页对象定位的准确率和定位的稳定性优于单独使用其中的任何一种方法。该方法主要分为两个阶段,分别是网页对象特征抽取阶段和网页对象定位阶段。 在网页对象定位特征抽取阶段,本文首先定义了网页对象特征描述语言,用来表达各种网页对象定位特征。该语言是开放的,可扩展的,以后还可以增加新的定位特征。然后,本文设计并实现了网页DOM树路径特征的提取方法,并在此基础上,先后提出了基于压缩树的网页对象定位方法和基于参考点的网页对象定位方法。这三种方法分别抽取网页对象的三种不同的辅助定位特征。 在网页对象定位阶段,本文不仅实现了基于上述三种特征的网页对象的定位方法,还实现了基于上述三种特征的融合的定位方法。 为了验证该方法的有效性,本文接着进行了测试,测试结果表明,本文提出的基于多特征融合的网页对象定位方法具有更高的准确性和稳定性。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 王秋;;校园网页设计[J];中国教育网络;2008年12期
2 王志会;;浅谈网页设计的认知因素[J];东方企业文化;2010年03期
3 杨振华,宋楚平,周建辉;视觉设计原理在网页设计中的运用[J];南通纺织职业技术学院学报;2004年04期
4 一号;;Dreamweaver必备网页设计技巧[J];网络与信息;2007年02期
5 任玉琢;陈键;赵建勋;;初探视觉搜索和网页设计的关系[J];艺术与设计(理论);2007年10期
6 阮渭平;;色彩在网页设计中的民族性研究[J];浙江工艺美术;2007年03期
7 刘佳;王倩;;网页设计中的色彩表现[J];美术大观;2007年11期
8 崔琦;;浅谈如何进行“DIV+CSS”教学[J];商场现代化;2009年19期
9 ;平面设计师生存手册(3) 机会风从网上来[J];电脑爱好者;2009年20期
10 王晓梅;;三载淬炼 一朝问鼎——记第五届全国ITAT大赛“Dreamweaver网页设计”项目特等奖获得者曾国锋[J];中等职业教育;2010年07期
11 钟月云;;《网页设计》课程教学研究与探讨——以福建工程学院软件学院为例[J];职业;2010年33期
12 杨少波;网页设计中的动态HTML应用技术[J];计算机时代;1999年02期
13 黄志军!430033湖北武汉,吴卫东!430033湖北武汉,赵皑!430033湖北武汉;开展网页设计竞赛 促进素质培养[J];海军院校教育;2000年03期
14 苏梅;网页设计与色彩心理学[J];企业经济;2002年07期
15 贾海龙,任玉珍;网页艺术设计[J];新乡师范高等专科学校学报;2005年05期
16 段新宇;;浅谈网页设计中的文字运用[J];赤峰学院学报(自然科学版);2007年01期
17 马玲;范晶;;网页设计课程实验环节的设计和研究[J];中国科技财富;2008年10期
18 许海;;中国传统水墨画在网页设计中的应用[J];艺海;2008年06期
19 涂杰;;视知觉在网页设计中的表现[J];艺海;2010年02期
20 王贵洁;刘辉;;使用FrontPage新建空白网页[J];品牌与标准化;2010年16期
中国重要会议论文全文数据库 前10条
1 王谨;;水墨风格在网页设计中的运用[A];城市文化与艺术审美[C];2008年
2 许文惠;;图书馆网站及网页设计初探[A];图书馆理论与实践[C];2002年
3 孙宇航;;科技期刊网站的建设探讨[A];第4届中国科技期刊青年编辑学术研讨会论文集[C];2004年
4 姚秋明;甄莉;;基于NEWS油藏综合解释系统的网站建设[A];油气地球物理实用新技术——中国石化石油勘探开发研究院南京石油物探研究所2005年学术交流会论文集[C];2005年
5 杨孙超;;县级公共图书馆网站建设的思考[A];福建省图书馆学会2006年学术年会论文集[C];2006年
6 施绍萍;孙兴玉;邱建丁;;基于多特征融合预测蛋白甲基化位点的研究[A];第十一届全国计算(机)化学学术会议论文摘要集[C];2011年
7 曹淮;晁丁丁;;3D元素在网页信息传达中的应用研究[A];2006年中国机械工程学会年会暨中国工程院机械与运载工程学部首届年会论文集[C];2006年
8 张冬雨;李乃民;王宽全;贾丹兵;刘珊;李艳来;陈倩;;基于决策层多特征融合的脉象分类研究[A];第四次全国中西医结合诊断学术研讨会论文集[C];2010年
9 时达明;林鸿飞;杨志豪;;基于网页框架和规则的网页噪音去除方法[A];第三届学生计算语言学研讨会论文集[C];2006年
10 杜玉梅;杜习英;刘晓云;;中小企业网站建设方案[A];计算机模拟与信息技术会议论文集[C];2001年
中国博士学位论文全文数据库 前10条
1 李先锋;基于特征优化和多特征融合的杂草识别方法研究[D];江苏大学;2010年
2 田纲;基于多特征融合的Mean shift目标跟踪技术研究[D];武汉大学;2011年
3 郭丽;基于内容的商标图像检索研究[D];南京理工大学;2003年
4 郑建明;基于HMM的多特征融合钻头磨损监测技术的研究[D];西安理工大学;2004年
5 尹宏鹏;基于计算机视觉的运动目标跟踪算法研究[D];重庆大学;2009年
6 王欢;运动目标检测与跟踪技术研究[D];南京理工大学;2009年
7 曾璞;面向语义提取的图像分类关键技术研究[D];国防科学技术大学;2009年
8 陶超;高分辨率遥感影像中的城区与建筑物检测方法研究[D];华中科技大学;2012年
9 商飞;面向大型科学仪器网络实验室的视觉视频关键技术研究与应用[D];吉林大学;2009年
10 刘云鹤;基于注意机制的红外小目标检测与跟踪算法研究[D];哈尔滨工程大学;2009年
中国硕士学位论文全文数据库 前10条
1 任昌;基于多特征融合的网页对象自动定位技术研究[D];中北大学;2011年
2 刘俊荣;基于行为识别的网页文本分类算法研究与实现[D];北京邮电大学;2010年
3 宋鳌;网页去噪在交互电视中的应用与研究[D];上海交通大学;2011年
4 彭聪;一种在移动网络环境下的网页排序算法的研究[D];湖南大学;2010年
5 刘阳;基于内容的搜索引擎网页去重研究[D];江苏大学;2010年
6 陈烨;面向用户体验的网页界面优化设计方法研究[D];重庆大学;2010年
7 刘典型;多页面特殊网页文字提取与合并技术研究[D];湖南大学;2010年
8 董娟;基于页面结构分析的网页信息抽取方法研究[D];中国石油大学;2010年
9 宋玲;网页交互设计的视觉体验[D];西安美术学院;2010年
10 戴支荣;基于Lucene的面向主题信息搜索系统的关键技术分析及应用[D];武汉理工大学;2011年
中国重要报纸全文数据库 前10条
1 酷娱网设计部经理 王民;网页设计面试常见四陋习[N];电脑报;2010年
2 Relen;个性网页设计之内容艺术[N];电脑报;2001年
3 Relen;个性网页设计之创意无限[N];电脑报;2001年
4 河南 张金贵;网页设计布局心得[N];电脑报;2001年
5 西安市第十九中学 丁锦;网页设计中的色彩搭配[N];学知报;2011年
6 记者 薛亚芳;网络美工,动手能力最重要[N];人才市场报;2011年
7 吴兴国;网页设计的几项原则[N];山西科技报;2000年
8 实习生 郭晓;“我设计的软件是独一无二的”[N];科技日报;2006年
9 王楠;网页设计:网站的灵魂工程师[N];电脑报;2010年
10 商报记者 何衡柯;四大快递本土化瓶颈待破[N];北京商报;2011年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978