收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于知识模型推理的Deep Web数据源分类研究

黄黎  
【摘要】: 互联网的飞速发展使Web信息量不断膨胀,为人们提供了可供访问的海量信息。其中蕴含的庞大Web信息正在不断深化,由于其隐藏于查询接口之后,无法利用传统的搜索引擎技术获取,因而被称为Deep Web。高速增长的Deep Web信息已成为人们进行信息获取的一个重要来源,然而Deep Web数据的异构性和动态性,为大规模DeepWeb数据集成带来巨大的挑战。Deep Web数据源分类在大规模数据集成中的重要性正在逐渐凸显。 本文针对Deep Web数据源分类的关键技术进行深入研究,提出了一种新颖的基于知识模型推理的增强型分类模型,有效地解决了传统分类方法的局限性。本文的主要研究工作如下: (1)研究了Deep Web结构化查询接口中可视化特征的规律性,提出了一种基于信息熵和共现特征的BOW选择方法。有效的特征选择是特征划分的重要前提。 (2)分析了基于BOW的特征分类方法的不足,提出了基于知识模型的特征推理模型,弥补了BOW集合的有限性。 (3)采用了基于潜在语义分析方法的层次化知识库特征选择方法,并构造基于Wikipedia知识库的辅助分类器。 (4)提出了基于知识模型推理的增强型Deep Web数据源分类模型,将领域概念丰富的辅助分类器应用于有限的Deep Web查询接口特征分类中,实现特征的语义推理和领域化概念的扩充。 本文最后在真实的UIUC Web数据集上进行实验验证,通过对实验结果的分析比较,验证了本文提出的分类策略是有效的,具有较高的分类精度和应用价值。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 赵朋朋;高岭;崔志明;;基于查询接口特征的Deep Web数据源自动分类[J];微电子学与计算机;2006年10期
2 张超;张树生;周竞涛;赵寒;;需求驱动的语义模型构建方法研究[J];计算机应用研究;2006年11期
3 吕岳东;陈立潮;郭勇义;张英俊;;基于本体的煤炭科学数据集成模型研究[J];微计算机信息;2010年31期
4 杜杏菁;于咏霞;刘春梅;;部分遮挡人脸的检测技术分析[J];华北科技学院学报;2009年01期
5 邹生,张建国;IDSS开发的面向对象的综合集成方法[J];计算机工程与应用;1998年08期
6 张蒲生,苏运霖;基于政务数据仓库的数据集成及关键技术[J];计算机工程;2003年09期
7 吴健鸣;;利用Java实现Lotus Domino和数据库系统的数据集成[J];上海电机学院学报;2006年03期
8 丁继红;高秋华;;基于移动Agent技术的粮食作物产量预测模型研究[J];吉林农业大学学报;2006年06期
9 范志勇;肖冬荣;张群;;基于PDM框架下的CAPP与PDM的数据集成[J];微计算机信息;2007年04期
10 武树东;赵全明;索依娜;;物流信息系统中的数据集成技术[J];商场现代化;2007年10期
11 罗昊;杨志新;杨贯中;;Protégé知识模型的研究[J];科学技术与工程;2007年18期
12 于鑫刚;李万龙;;基于本体的知识库模型研究[J];计算机工程与科学;2008年06期
13 张恩;刘春红;段德全;;基于XML/Web Services的异构数据集成研究[J];广西师范大学学报(自然科学版);2008年03期
14 刘高嵩;龙军;;基于CORBA和Web Services的异构数据源集成研究[J];计算机系统应用;2009年07期
15 丁鸣艳;聂冰;赵慧敏;李文;;模糊系统知识模型(Ⅱ):范畴、知识及其近似与度量[J];大连交通大学学报;2010年02期
16 刘春玲;;基于虚拟视图的教务管理数据集成方式研究[J];电脑知识与技术;2010年19期
17 连云峰;卢昱;陈立云;马懿;;军械装备保障模拟训练系统数据集成研究[J];信息技术;2011年05期
18 王艳君,王运格,吴丽红;异构数据库间数据集成的方法[J];烟台师范学院学报(自然科学版);1999年04期
19 李军怀,张景,周明全,耿国华;基于XML的企业异构数据集成方法研究[J];计算机工程;2002年09期
20 石晓祥,陈军,彭颖红,阮雪榆;覆盖件产品信息模型与基于知识的设计系统的集成[J];模具技术;2002年01期
中国重要会议论文全文数据库 前10条
1 赵朋朋;高岭;崔志明;;基于查询接口特征的Deep Web数据源自动分类[A];2006年全国开放式分布与并行计算学术会议论文集(二)[C];2006年
2 姜芳艽;贾琳琳;孟小峰;;Deep Web数据集成中基于最小超集的查询转换[A];第二十四届中国数据库学术会议论文集(研究报告篇)[C];2007年
3 凌妍妍;刘伟;王仲远;艾静;孟小峰;;Deep Web数据集成中的实体识别方法[A];第二十三届中国数据库学术会议论文集(研究报告篇)[C];2006年
4 王英;左万利;王鑫;彭涛;;基于多分类器的Deep Web入口发现[A];第六届全国信息检索学术会议论文集[C];2010年
5 曹禹;申德荣;于戈;余恩运;周文生;寇月;;数据网格内一种基于本体的数据集成处理机制[A];第二十二届中国数据库学术会议论文集(研究报告篇)[C];2005年
6 胡鹏昱;苗忠义;崔志明;方巍;;扩展的Deep Web质量估计模型研究[A];2008年全国开放式分布与并行计算机学术会议论文集(上册)[C];2008年
7 祝晓红;刘炜;李俊丽;;用WPF进行复杂数据集成的方法研究[A];第二十七届中国控制会议论文集[C];2008年
8 黄卿贤;胡谷雨;;基于本体的网络管理知识模型[A];2003年通信软件技术学术年会论文集[C];2003年
9 余伟;李石君;洪辉;田建伟;;基于覆盖关系的Deep Web数据源排名[A];第二十四届中国数据库学术会议论文集(研究报告篇)[C];2007年
10 王上;于海;王钲旋;;Deep Web垂直搜索引擎设计与实现[A];第26届中国数据库学术会议论文集(B辑)[C];2009年
中国博士学位论文全文数据库 前10条
1 吴春明;Deep Web数据集成关键技术及其在农业领域的应用[D];西南大学;2011年
2 田建伟;面向领域的高质量Deep Web数据集成技术研究[D];武汉大学;2010年
3 董永权;Deep Web数据集成关键问题研究[D];山东大学;2010年
4 王英;Deep Web数据集成关键技术研究[D];吉林大学;2010年
5 闫中敏;Deep Web数据获取问题研究[D];山东大学;2010年
6 黄健斌;基于条件概率图模型的Deep Web数据抽取与集成研究[D];西安电子科技大学;2007年
7 王欣;数据集成技术若干问题的研究[D];上海交通大学;2010年
8 张慧斌;Deep Web查询接口及查询结果抽取研究[D];南开大学;2010年
9 蒋永国;面向传感网的海洋观测数据集成关键技术研究[D];中国海洋大学;2010年
10 潘鹏;Deep Web查询中的不确定性问题研究[D];山东大学;2010年
中国硕士学位论文全文数据库 前10条
1 黄黎;基于知识模型推理的Deep Web数据源分类研究[D];苏州大学;2009年
2 颜无瑕;Deep Web数据集成中模式匹配研究[D];曲阜师范大学;2011年
3 陈尚安;林业企业黄页Deep Web数据集成研究[D];北京林业大学;2012年
4 陈佳佳;Deep Web数据集成研究及其在购书领域中的应用[D];暨南大学;2010年
5 戚春超;Deep Web数据源发现与分类研究[D];南京信息工程大学;2011年
6 窦会涛;面向Deep Web数据集成的数据融合问题研究[D];山东大学;2012年
7 张红宇;数据集成中本体映射的研究[D];中南大学;2005年
8 缪建明;集散控制系统的数据集成的研究与应用[D];福州大学;2003年
9 刘军;分布式智能异构数据集成支持系统的原型实现[D];大连海事大学;2003年
10 李凯;面向SCM数据集成的DW解决方案研究[D];大连理工大学;2006年
中国重要报纸全文数据库 前10条
1 于翔;谁碾碎了数据?[N];网络世界;2007年
2 ;SaaS需要数据集成[N];网络世界;2007年
3 陈友梅;数据集成 永中Office之本[N];中国计算机报;2002年
4 邹大斌;发挥数据的最大价值[N];计算机世界;2007年
5 姜学军(山东省医药卫生科技信息研究所) 程永(浪潮商用系统公司;山东省地税系统的数据集成[N];电脑商报;2005年
6 李稚;“集成”的困惑[N];计算机世界;2002年
7 于翔 王翔;收复数据孤岛[N];网络世界;2007年
8 刘学纲;互联互通平台的数据集成[N];中国计算机报;2003年
9 朱文;CIO希望攻克数据质量关[N];计算机世界;2008年
10 本报记者 邹大斌;Informatica:从数据中淘金[N];计算机世界;2008年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978