收藏本站
《河北大学》 2009年
收藏 | 手机打开
二维码
手机客户端打开本文

Deep Web数据库的选择研究

樊敬川  
【摘要】:随着Internet相关技术的日益成熟,Web上积累了大量的在线数据库,其中所蕴含的信息对于用户来说是不可见的,称之为Deep Web。建立Deep Web数据集成系统是当前从Deep Web中获取信息的有效方式。为了提高信息检索的效率和查询的准确度,DeepWeb数据库的选择是建立Deep Web数据集成系统的一个必不可缺的环节。 在Web数据库选择方面,本文主要是在设计代表性查询以获取Web数据库特征和针对特定查询对Web数据库进行排序两个方面做了重点研究。 在获取Web数据库特征方面,文中根据领域知识构建初始查询词集合。由于查询词集合的动态更新性,随着用户的提交逐步建立起具有代表性的频繁查询词集合,并向各个本地Web数据库提交频繁查询词,通过分析Web数据库返回结果中出现查询词的位置和包含关系获取Web数据库的特征。 在Web数据库排序方面,按照其特征对Web数据库返回结果进行分类,以每类返回结果与查询词的相关度和每类返回结果在全部Web数据库相应类别中所占的比例两者作为参数计算出整个Web数据库与查询词的相关度,按照相关度的大小对所有的Web数据库进行排序。在己排序的基础上,通过分析与查询词的完全相关结果增长率确定选择出的Web数据库个数阈值,从而获得既高效又准确的部分Web数据库。最后对于用户提交的新查询词,本文将前一步选择出的部分Web数据库作为输入,利用Apriori算法计算出最大频繁项集,即将最被频繁查询的Web数据库作为新查询词的默认Web数据库选择序列。实验表明,该方法能够有效的评估各个Web数据库对特定查询的支持能力。
【学位授予单位】:

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 黄海贵;Windows NT IIS与数据库信息发布[J];计算机周刊;1997年27期
2 杨晓南;甘正华;员宁敏;黄新苏;;数据库系统开发设计结构、功能与特点——高校科研论著归档与信息数据库的建立[J];档案与建设;2006年04期
3 夏野;易成刚;;科技计划项目数据库资源的整合与应用[J];软件导刊;2008年11期
4 王惠荣;;基于RSA算法的数据库加密技术研究[J];科技信息;2009年09期
5 许方恒;毛颉;;数据库加密模型研究[J];计算机与信息技术;2009年06期
6 许方恒;;数据库加密模型研究[J];电脑知识与技术;2009年23期
7 王淑华;刘燕;黄琳;李江玲;马军;梁静;董恒;肖春连;;医院图书馆数据库信息服务模式研究[J];医学信息;2010年02期
8 王进生;;C-DBASE数据库通用信息表格生成系统[J];微型机与应用;1988年02期
9 蒋晶;刘同明;;基于数据库信息构建贝叶斯网络的免疫遗传算法[J];计算机应用;2005年S1期
10 蒋继生;;论高校图书馆数据库的合法用户及其权利[J];图书馆;2008年03期
11 祁业凤;刘平;刘孟军;;枣智能专家系统数据库信息化推广应用[J];中国农学通报;2009年21期
12 王文亮;;GOOGLE搜索引擎的暴库分析及防范措施研究[J];信息系统工程;2010年05期
13 颜惠琴;;VB6.0中TreeView控件的使用[J];电脑知识与技术(学术交流);2006年14期
14 郭根生;;数码照片背后的故事——用ACDSee图片浏览软件解读数码照片的信息[J];照相机;2006年05期
15 张建军;;浅析数据库系统管理加密技术及其应用[J];甘肃高师学报;2006年05期
16 王乾坤;;软件试用中的“护航”系统[J];软件导刊;2007年19期
17 赵亚慧;;基于数据库的高校设备采购管理系统的应用研究[J];黑龙江科技信息;2008年36期
18 曹迎槐;;数据库管理系统之参照完整性技术研究[J];信息系统工程;2009年06期
19 钟嵘;用VB开发数据库信息管理系统经验谈(一)[J];医学信息;2000年04期
20 郑睿;;美国数据库公司一瞥[J];图书馆杂志;2003年01期
中国重要会议论文全文数据库 前10条
1 闫中敏;李庆忠;彭朝晖;董永权;丁艳辉;张永新;徐秀星;;DWDIS:面向分析的Deep Web数据集成系统[A];NDBC2010第27届中国数据库学术会议论文集(B辑)[C];2010年
2 陶然;江锦华;吴羽;陈刚;;基于树合并的Deep Web查询接口集成[A];第26届中国数据库学术会议论文集(B辑)[C];2009年
3 余伟;李石君;洪辉;田建伟;;基于覆盖关系的Deep Web数据源排名[A];第二十四届中国数据库学术会议论文集(研究报告篇)[C];2007年
4 王上;于海;王钲旋;;Deep Web垂直搜索引擎设计与实现[A];第26届中国数据库学术会议论文集(B辑)[C];2009年
5 梁浩;左万利;任斐;赫枫龄;;基于启发式信息的Deep Web查询接口属性抽取[A];第26届中国数据库学术会议论文集(B辑)[C];2009年
6 王英;左万利;王鑫;彭涛;;Deep Web查询转换研究[A];第六届全国信息检索学术会议论文集[C];2010年
7 王英;左万利;王鑫;彭涛;;基于多分类器的Deep Web入口发现[A];第六届全国信息检索学术会议论文集[C];2010年
8 王英;左万利;彭涛;赫枫龄;彭钊;;应用领域本体知识库自动填充Deep Web入口表单[A];第二十五届中国数据库学术会议论文集(二)[C];2008年
9 朱命冬;申德荣;寇月;聂铁铮;于戈;;一种应用于Deep Web环境下的重复记录识别模型[A];第26届中国数据库学术会议论文集(B辑)[C];2009年
10 艾静;王仲远;孟小峰;;C-Rank:一种Deep Web数据记录可信度评估方法[A];第26届中国数据库学术会议论文集(A辑)[C];2009年
中国重要报纸全文数据库 前10条
1 闫洁;英两无罪公民起诉要求销毁DNA记录[N];新华每日电讯;2008年
2 湖北记者 刘智琳通讯员 向旭晖;“思乡月”营销 湖北邮政主打数据库牌[N];中国邮政报;2008年
3 曹江华;搭建Linux下的博客网站[N];计算机世界;2006年
4 岳德亮;浙江:建“行贿人数据库”,遏医药腐败[N];新华每日电讯;2007年
5 本报记者 缪海涛 毛翠娥;邮政“押宝”商业信函[N];无锡日报;2006年
6 赵法忠;1000万美元还是不够花[N];中国经营报;2007年
7 记者 杨菁通讯员 李汉梅;今年武汉商业信函量翻番[N];长江日报;2007年
8 本报记者 刘华;上万老赖被银行拒贷[N];成都日报;2006年
9 刘梦龙;数据库营销要有法律意识[N];中国邮政报;2008年
10 记者 陈坤;广西人足不出户可九省区求职揽才[N];广西日报;2006年
中国博士学位论文全文数据库 前10条
1 董永权;Deep Web数据集成关键问题研究[D];山东大学;2010年
2 王英;Deep Web数据集成关键技术研究[D];吉林大学;2010年
3 闫中敏;Deep Web数据获取问题研究[D];山东大学;2010年
4 田建伟;面向领域的高质量Deep Web数据集成技术研究[D];武汉大学;2010年
5 潘鹏;Deep Web查询中的不确定性问题研究[D];山东大学;2010年
6 吴春明;Deep Web数据集成关键技术及其在农业领域的应用[D];西南大学;2011年
7 张慧斌;Deep Web查询接口及查询结果抽取研究[D];南开大学;2010年
8 陈珂锐;基于本体演化的Deep Web数据抽取与注释[D];吉林大学;2011年
9 寇月;Deep Web实体搜索的关键技术研究[D];东北大学;2009年
10 梁浩;Deep Web信息集成架构及相关问题研究[D];吉林大学;2010年
中国硕士学位论文全文数据库 前10条
1 樊敬川;Deep Web数据库的选择研究[D];河北大学;2009年
2 李秀兰;基于结果模式的Deep Web语义标注研究[D];兰州理工大学;2011年
3 陈文;Deep Web入口识别和个性化搜索研究与设计[D];江苏大学;2010年
4 阚述贤;基于本体及概念模式的Deep Web查询结果处理技术[D];广西师范大学;2011年
5 杜鑫;Deep Web数据源发现与采样研究[D];山东大学;2011年
6 谢莹;Deep Web查询结果抽取及注释[D];吉林大学;2010年
7 王海龙;Deep Web数据源发现和分类研究[D];苏州大学;2011年
8 姚增利;基于领域知识的Deep Web接口发现研究[D];河北大学;2009年
9 张仲祥;基于领域本体的Deep Web数据源聚焦技术研究[D];广西师范大学;2011年
10 李伟静;图书领域DeepWeb数据库选择方法研究[D];河北大学;2010年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978