收藏本站
《东北大学》 2008年
收藏 | 手机打开
二维码
手机客户端打开本文

Deep Web环境下查询松弛技术的研究

马也  
【摘要】:随着信息技术的不断发展,Web上的信息量呈爆炸性增长。按照所蕴含信息深度的不同,可以将Web划分为Surface Web和Deep Web两大类。其中,Deep Web是指那些存储在Web数据库里、不能通过超链接访问而需要采用动态网页技术访问的资源集合。Deep Web中的信息量远远大于Surface Web中的信息量,有效地利用这些信息,能够更加充分地发挥Internet的作用。然而,在查询信息的过程中难免会产生失败查询,即没有结果返回的查询。对失败查询进行处理,使其返回与用户意愿比较相近的结果,比告知用户没有结果更具协作性,更有意义。 本文基于对Deep Web环境的观察和分析,提出了一种Deep Web环境下查询松弛的解决方案。首先,利用查询探测获得未知数据源的样本信息,并根据样本信息计算各个属性的近似函数依赖关系,得到属性重要度;然后,通过变换数据源关系全图得到针对于查询请求的数据源关系图;最后,利用这个数据源关系图,就可以按照特定的规则进行查询松弛和执行过程。 由于查询松弛的存在,从各数据源得到的结果数量可能很大,部分结果与用户查询请求的相似度较低,因此从各数据源得到结果后,先通过skyline方法对结果进行筛选,然后根据各个结果实例与用户查询的相似度进行排序,将最接近用户要求的结果集返回给用户。 以此查询松弛和结果过滤方法为基础,实现了Deep Web搜索引擎DWSearch中的查询处理子系统。出于处理并发访问的考虑,该系统采用了分布式设计。以DWSearch系统为平台,通过实验验证了本文提出的查询松弛和结果过滤办法的有效性。
【学位授予单位】:东北大学
【学位级别】:硕士
【学位授予年份】:2008
【分类号】:TP393.09

【共引文献】
中国博士学位论文全文数据库 前2条
1 冯红伟;数据挖掘技术的研究及应用[D];西北工业大学;2002年
2 缑锦;知识融合中若干关键技术研究[D];浙江大学;2005年
中国硕士学位论文全文数据库 前2条
1 张晓丹;基于SOAP/XML的应用集成模型的设计与实现[D];暨南大学;2003年
2 谭狄溪;基于本体的异构数据源的集成研究[D];中南大学;2004年
【相似文献】
中国期刊全文数据库 前10条
1 侯毅;;基于Deep Web的主题搜索引擎的系统设计[J];数字技术与应用;2011年02期
2 苏晓珂;赵磊;黄青松;;Deep Web中基于迭代的查询方式[J];云南民族大学学报(自然科学版);2007年01期
3 段晓飞;张素智;马红;;基于Deep Web的模式匹配算法研究[J];郑州轻工业学院学报(自然科学版);2008年03期
4 谢丽聪,白清源;数据集成系统中数据源描述的框架方法[J];福州大学学报(自然科学版);2002年03期
5 王贤;苏晓珂;黄青松;;基于Zipf Estimator的Deep Web最佳查询词选择[J];计算机技术与发展;2007年03期
6 方丽;李锡辉;;基于Deep Web挖掘的搜索策略[J];福建电脑;2008年03期
7 藕军;任明仑;左春荣;章成志;;中文Deep Web的大小、质量及分布[J];情报学报;2008年02期
8 张玉峰;吴金红;王翠波;;面向Deep Web的动态竞争情报智能采集策略[J];情报学报;2008年04期
9 茅琴娇;冯博琴;潘善亮;;Deep web站点查询界面的潜在语义分析(英文)[J];Journal of Southeast University(English Edition);2008年03期
10 马也;张峥;张辉;;基于决策树的查询接口识别技术[J];微计算机信息;2008年33期
中国重要会议论文全文数据库 前10条
1 余伟;李石君;洪辉;田建伟;;基于覆盖关系的Deep Web数据源排名[A];第二十四届中国数据库学术会议论文集(研究报告篇)[C];2007年
2 王上;于海;王钲旋;;Deep Web垂直搜索引擎设计与实现[A];第26届中国数据库学术会议论文集(B辑)[C];2009年
3 梁浩;左万利;任斐;赫枫龄;;基于启发式信息的Deep Web查询接口属性抽取[A];第26届中国数据库学术会议论文集(B辑)[C];2009年
4 王英;左万利;王鑫;彭涛;;Deep Web查询转换研究[A];第六届全国信息检索学术会议论文集[C];2010年
5 闫中敏;李庆忠;彭朝晖;董永权;丁艳辉;张永新;徐秀星;;DWDIS:面向分析的Deep Web数据集成系统[A];NDBC2010第27届中国数据库学术会议论文集(B辑)[C];2010年
6 王英;左万利;王鑫;彭涛;;基于多分类器的Deep Web入口发现[A];第六届全国信息检索学术会议论文集[C];2010年
7 王英;左万利;彭涛;赫枫龄;彭钊;;应用领域本体知识库自动填充Deep Web入口表单[A];第二十五届中国数据库学术会议论文集(二)[C];2008年
8 朱命冬;申德荣;寇月;聂铁铮;于戈;;一种应用于Deep Web环境下的重复记录识别模型[A];第26届中国数据库学术会议论文集(B辑)[C];2009年
9 陶然;江锦华;吴羽;陈刚;;基于树合并的Deep Web查询接口集成[A];第26届中国数据库学术会议论文集(B辑)[C];2009年
10 艾静;王仲远;孟小峰;;C-Rank:一种Deep Web数据记录可信度评估方法[A];第26届中国数据库学术会议论文集(A辑)[C];2009年
中国博士学位论文全文数据库 前10条
1 寇月;Deep Web实体搜索的关键技术研究[D];东北大学;2009年
2 闫中敏;Deep Web数据获取问题研究[D];山东大学;2010年
3 田建伟;面向领域的高质量Deep Web数据集成技术研究[D];武汉大学;2010年
4 潘鹏;Deep Web查询中的不确定性问题研究[D];山东大学;2010年
5 王英;Deep Web数据集成关键技术研究[D];吉林大学;2010年
6 董永权;Deep Web数据集成关键问题研究[D];山东大学;2010年
7 吴春明;Deep Web数据集成关键技术及其在农业领域的应用[D];西南大学;2011年
8 梁浩;Deep Web信息集成架构及相关问题研究[D];吉林大学;2010年
9 张慧斌;Deep Web查询接口及查询结果抽取研究[D];南开大学;2010年
10 陈珂锐;基于本体演化的Deep Web数据抽取与注释[D];吉林大学;2011年
中国硕士学位论文全文数据库 前10条
1 马也;Deep Web环境下查询松弛技术的研究[D];东北大学;2008年
2 陈文;Deep Web入口识别和个性化搜索研究与设计[D];江苏大学;2010年
3 王培正;基于Deep Web的网络信息抽取技术研究[D];华南理工大学;2010年
4 李秀兰;基于结果模式的Deep Web语义标注研究[D];兰州理工大学;2011年
5 刘富江;网络数据源模式识别方法及策略研究[D];哈尔滨工程大学;2010年
6 刘为;Deep Web环境下数据抽取及模式识别的研究[D];东北大学;2008年
7 邓烨;面向特定领域的Deep Web数据自动抽取[D];中国海洋大学;2012年
8 蔡欣宝;Deep Web数据获取方法研究[D];苏州大学;2010年
9 张旭;面向Deep Web响应页面的模式识别的研究[D];东北大学;2008年
10 刘凯;Deep Web数据集成关键技术研究[D];长春工业大学;2012年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026