收藏本站
《江苏大学》 2010年
收藏 | 手机打开
二维码
手机客户端打开本文

Deep Web入口识别和个性化搜索研究与设计

陈文  
【摘要】: 用户对Deep Web站点的访问主要是通过其在Web页面中提供的具有特定查询能力的接口来获取所需要的结果。为了帮助用户简单高效的查找Deep Web信息,就必须提供统一的查询接口,方便用户对多个Deep Web站点同时进行查询。而Deep web入口识别是整个DeepWeb集成搜索的重要组成部分,是搜索信息的来源和后续工作的前提,对整个Deep Web集成系统有着重要的意义。同时,大量的DeepWeb信息犹如浩瀚的海洋,为了使得Deep Web集成搜索获得的数据具有更高的使用价值,避免“信息过载”,就要对Deep Web集成搜索的结果进行处理,为用户提供个性化Deep Web集成搜索服务。 本文重点研究了Deep Web入口识别和Deep Web集成结果显示的相关技术,给出了一种具有增量学习能力的PU主动学习算法并应用到Deep Web入口识别中以及一种面向Deep Web集成的个性化搜索方法,最后设计和实现了一个面向Deep Web集成的个性化搜索原型系统。 本文主要研究的内容包括: (1)研究如何从不断增加的Web页面中判断出Deep Web入口并对其分类。针对初始正例样本较少并且不同类别反例获取困难的情形,给出了一种具有增量学习能力的PU主动学习算法,该算法使用三个支持向量机进行协同半监督学习的同时,利用基于网格的聚类方法进行无监督学习,当分类与聚类结果不一致时,引入主动学习来标记无标记样本。将该算法应用于Deep Web入口的在线判断和分类中,实验表明,该方法能提高新的类型的发现能力以及处理增量无标记样本的能力。 (2)为了缓解Deep Web集成搜索结果页面中信息量过大,导致信息过载的问题,给出了一种面向Deep Web集成的个性化搜索方法。该方法利用Deep Web站点目录和用户调查表生成兴趣树,并根据用户反馈和成员Deep Web站点返回的参数等更新用户兴趣。针对不同的用户兴趣对页面进行过滤和排序,从而得到最终显示页面。实验结果表明,该方法优化了Deep Web集成搜索,使得用户感兴趣的个性化信息更加突出。 (3)设计和实现了一个面向Deep Web集成的个性化搜索原型系统,并将上文给出的技术在该系统上的应用做了分析。实际应用表明,该系统可以取得较好的效果。
【学位授予单位】:江苏大学
【学位级别】:硕士
【学位授予年份】:2010
【分类号】:TP391.3

【相似文献】
中国期刊全文数据库 前10条
1 张浩军,祝跃飞,陈莉,庞红玲;WAPI中ASU的研究与设计[J];计算机应用研究;2005年06期
2 ;《电子测量技术》2008年总目次[J];电子测量技术;2008年12期
3 黄国峰;;网络教学模式的研究与设计思想[J];武汉船舶职业技术学院学报;2002年02期
4 陈明忠;基于Web的教学评价系统的研究与设计[J];广东科技;2005年08期
5 唐春生;基于WAP的水利无线查询系统研究与设计[J];江苏水利;2005年08期
6 侯毅;;基于Deep Web的主题搜索引擎的系统设计[J];数字技术与应用;2011年02期
7 苏晓珂;赵磊;黄青松;;Deep Web中基于迭代的查询方式[J];云南民族大学学报(自然科学版);2007年01期
8 段晓飞;张素智;马红;;基于Deep Web的模式匹配算法研究[J];郑州轻工业学院学报(自然科学版);2008年03期
9 欧阳勇;马忠宝;;网络会议系统中的信息协同研究与设计[J];信息与电脑(理论版);2009年11期
10 王贤;苏晓珂;黄青松;;基于Zipf Estimator的Deep Web最佳查询词选择[J];计算机技术与发展;2007年03期
中国重要会议论文全文数据库 前10条
1 王翠茹;袁和金;许正伟;马慧敏;;基于Web和COM组件技术的DSS研究与设计[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
2 郑永真;陈挺进;陈红岩;;汽车发动机机油性能检测仪的研究与设计[A];中国汽车工程学会燃料与润滑油分会第十四届年会论文集[C];2010年
3 高欣;刘衡竹;张波涛;;高速缓存优化研究与设计[A];第十五届计算机工程与工艺年会暨第一届微处理器技术论坛论文集(A辑)[C];2011年
4 宋亚男;刘春和;李新俊;齐俊臣;;导弹贮存可靠性数据仓库的研究与设计[A];中国电子学会可靠性分会第十三届学术年会论文选[C];2006年
5 臧安民;杨宏强;陈风扬;陆小华;;偏心受压劲性钢筋砼柱(外包砼格构柱)的研究与设计[A];混凝土结构基本理论及应用第二届学术讨论会论文集(第二卷)[C];1990年
6 周国祥;陆文海;;基于BHO技术的数字版权保护系统的研究与设计[A];第六届中国测试学术会议论文集[C];2010年
7 唐信源;刘人杰;;内河航行移动通信网中船岸设备的研究与设计[A];中国航海学会优秀论文文摘及学术会议论文目次汇编(1990—1991)[C];1992年
8 胡维华;谢雪平;;网络教学平台的研究与设计[A];电子高等教育学会2003年学术年会论文集[C];2003年
9 徐文芳;刘宏伟;舒燕君;马闯;;三模冗余容错系统管理板的研究与设计[A];第十四届全国容错计算学术会议(CFTC'2011)论文集[C];2011年
10 余伟;李石君;洪辉;田建伟;;基于覆盖关系的Deep Web数据源排名[A];第二十四届中国数据库学术会议论文集(研究报告篇)[C];2007年
中国重要报纸全文数据库 前10条
1 东南大学WAP研究小组;无线应用环境的研究与设计[N];计算机世界;2000年
2 王贵;打造中国西部茶海构想之——[操作][N];贵州日报;2006年
3 王梦蛟;学习型红外遥控装置的研究与设计[N];电子资讯时报;2008年
4 本报记者 武永召 《乡音》杂志记者 袁克难;赵继英 一位真正的“学者”[N];人民政协报;2000年
5 本版采写 本报记者 丁晶;计算机科学与技术(上)[N];中国电脑教育报;2007年
6 刘莹;张在元激情与才情同在[N];科技日报;2005年
7 记者 黄磊吴志远 实习生 晓舟 通讯员 杜建平;中铁科工集团昨在汉组建[N];湖北日报;2008年
8 ;保本型基金如何保本[N];证券日报;2003年
9 曾鸣 张艳馥;节约型社会需求侧管理的研究重点[N];中国电力报;2007年
10 段会珍;河南科大百余项科研项目获得创新基金资助[N];科技日报;2007年
中国博士学位论文全文数据库 前10条
1 闫中敏;Deep Web数据获取问题研究[D];山东大学;2010年
2 田建伟;面向领域的高质量Deep Web数据集成技术研究[D];武汉大学;2010年
3 潘鹏;Deep Web查询中的不确定性问题研究[D];山东大学;2010年
4 王英;Deep Web数据集成关键技术研究[D];吉林大学;2010年
5 董永权;Deep Web数据集成关键问题研究[D];山东大学;2010年
6 吴春明;Deep Web数据集成关键技术及其在农业领域的应用[D];西南大学;2011年
7 梁浩;Deep Web信息集成架构及相关问题研究[D];吉林大学;2010年
8 张慧斌;Deep Web查询接口及查询结果抽取研究[D];南开大学;2010年
9 陈珂锐;基于本体演化的Deep Web数据抽取与注释[D];吉林大学;2011年
10 寇月;Deep Web实体搜索的关键技术研究[D];东北大学;2009年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026