收藏本站
《东北大学》 2008年
收藏 | 手机打开
二维码
手机客户端打开本文

面向Deep Web响应页面的模式识别的研究

张旭  
【摘要】:随着信息技术的不断发展,Web上的信息量呈爆炸性增长。按照所蕴含信息深度的不同,可以将Web划分为Surface Web和Deep Web两大类。其中,Deep Web是指那些存储在Web数据库里、不能通过超链接访问而需要采用动态网页技术访问的资源集合。一些统计数据表明:Deep Web蕴含的信息量、对Deep Web的访问量、增长速度等都远远高于Surface Web。因此,随着Web数据库的不断增长,通过对Deep Web的访问逐渐成为获取信息的主要手段,能够自动地获取蕴含在Deep Web中丰富的数据资源并对其进行大规模集成显得尤为重要。 当今查询Web信息的主要手段是借助搜索引擎,而传统搜索引擎只能爬取到SurfaceWeb信息,对于大量由Deep Web产生的动态数据不是索引的数据不全就是过时。因而搜索引擎对Deep Web的支持越来越成为广大用户的需求。而由于Deep Web的自身特点,又使实现这一需求在技术上存在很大的难度。 本文从实际出发,分析了Deep Web查询接口及其响应页面的特点,基于Deep Web自身的特点提出了一种基于Deep Web搜索引擎架构,描述了其架构设计,并且详细叙述了在预处理子系统中提出的两种用于抽取相应模式的算法,即基于询问式和基于输入接口式的输入模式抽取算法。 实验表明,我们提出的两种方法在不同的情况下有很好的识别率,结合这两种算法可以很好的解决Deep Web输入接口的识别问题。为建立基于Deep Web的搜索引擎提供理论上的支持。
【学位授予单位】:东北大学
【学位级别】:硕士
【学位授予年份】:2008
【分类号】:TP393.092

【参考文献】
中国期刊全文数据库 前2条
1 孔令波;唐世渭;杨冬青;王腾蛟;高军;;XML数据的查询技术[J];软件学报;2007年06期
2 黄健斌;姬红兵;孙鹤立;;近似重复记录的自适应距离度量检测[J];西安电子科技大学学报;2007年02期
【共引文献】
中国期刊全文数据库 前10条
1 张彦超;刘云;李勇;沈波;;基于自动生成模板的Web信息抽取技术[J];北京交通大学学报;2009年05期
2 毕鲁雁;焦宗夏;范圣韬;;机电系统多学科综合设计异构信息集成[J];北京航空航天大学学报;2009年04期
3 赵凯;冯百明;陈旺虎;;虚拟组织的资源查询机制研究[J];电脑知识与技术;2012年14期
4 蔡海尼;何盼;文俊浩;桑春艳;;面向服务架构的数据服务在数据访问中的应用[J];重庆大学学报;2009年10期
5 曾霞霞;;基于XML构建银证异构数据交换系统[J];闽江学院学报;2010年05期
6 唐欢徕;;XML在可扩展CRM系统中的应用[J];电子设计工程;2010年09期
7 贺道德;刘传山;江涛;;QoS服务模型的分析与研究[J];电脑知识与技术;2012年28期
8 王鹏;张晓琳;;基于序列的不确定XML整体小枝查询技术[J];电子科技;2013年11期
9 谌志群;周其力;;基于综合语义的XML文档相似度计算方法[J];杭州电子科技大学学报;2009年03期
10 刘波;杨路明;雷刚跃;谢东;;融合粒子群与蚁群算法优化XML群体智能搜索[J];计算机研究与发展;2008年08期
中国重要会议论文全文数据库 前4条
1 杜琦;巩政;;基于字符串相似度的自动评分算法实现[A];2011年全国电子信息技术与应用学术会议论文集[C];2011年
2 赵宏;申超;;异构视频服务系统集成与调度策略研究[A];第13届中国系统仿真技术及其应用学术年会论文集[C];2011年
3 熊瑛;许建;;船舶信息集成平台技术研究[A];第四届全国船舶与海洋工程学术会议论文集[C];2009年
4 刘德喜;万常选;刘喜平;焦贤沛;;XML检索中的标签权重设置模型[A];NDBC2010第27届中国数据库学术会议论文集A辑二[C];2010年
中国博士学位论文全文数据库 前10条
1 潘鹏;Deep Web查询中的不确定性问题研究[D];山东大学;2010年
2 杨剑锋;适合并行的无干预文档聚类算法研究[D];武汉大学;2010年
3 陈珂锐;基于本体演化的Deep Web数据抽取与注释[D];吉林大学;2011年
4 沈洁;基于自动机的XML数据过滤研究[D];哈尔滨工程大学;2010年
5 聂铁铮;Deep Web中Web数据库集成关键技术的研究[D];东北大学;2009年
6 王琦;古代壁画的语义检索技术及应用研究[D];浙江大学;2011年
7 邵峰;XML数据管理中的结构查询技术研究[D];浙江大学;2008年
8 范颖捷;XML索引与查询的若干关键技术研究[D];复旦大学;2008年
9 刘波;XML数据智能管理若干关键技术研究[D];中南大学;2008年
10 王宏志;XML数据查询处理技术的研究[D];哈尔滨工业大学;2008年
中国硕士学位论文全文数据库 前10条
1 侯佳奇;社保联网审计中增量数据分布式处理的研究[D];哈尔滨工程大学;2010年
2 高鹏;基于数字电视平台的制播存一体化研究与设计[D];哈尔滨工程大学;2010年
3 刘晨;XML文档聚类的研究[D];大连理工大学;2010年
4 吴世汉;面向查询的XML文本摘要技术[D];江西财经大学;2010年
5 姜浩亮;基于期望信任效益函数的网格作业调度算法的研究与仿真[D];电子科技大学;2010年
6 陈旭;政务信息资源目录服务检索技术的研究与实现[D];东华大学;2011年
7 张云涛;关联规则研究及在服务器智能管理中的应用[D];山东师范大学;2011年
8 范志起;半结构化数据索引技术的研究[D];吉林大学;2011年
9 尹作鹏;个性化虚拟仪器的设计与实现[D];北京邮电大学;2011年
10 丁申宇;公用交通IC卡自助充值系统的研究与实现[D];南京理工大学;2011年
【二级参考文献】
中国期刊全文数据库 前6条
1 万常选,刘云生,徐升华,刘喜平,林大海;基于区间编码的XML索引结构的有效结构连接[J];计算机学报;2005年01期
2 王静,孟小峰,王珊;基于区域划分的XML结构连接[J];软件学报;2004年05期
3 孟小峰,周龙骧,王珊;数据库技术发展趋势[J];软件学报;2004年12期
4 王静,孟小峰,王宇,王珊;以目标节点为导向的XML路径查询处理[J];软件学报;2005年05期
5 孔令波;唐世渭;杨冬青;王腾蛟;高军;;XML数据索引技术[J];软件学报;2005年12期
6 孟小峰;王宇;王小锋;;XML查询优化研究[J];软件学报;2006年10期
【相似文献】
中国期刊全文数据库 前10条
1 ;系统识别与模式识别[J];电子科技文摘;2006年04期
2 汤光华;王俐莉;严榴香;陈琦;;基于支持向量机的雷达一维距离像识别[J];仪器仪表学报;2006年S1期
3 薛静;;基于时间序列算法与多层次分布式智能决策支持系统[J];计算机工程与设计;2007年15期
4 易玲;;基于分级的快速霍夫变换直线检测[J];微计算机信息;2007年31期
5 林琦;;基于小波概率神经网络的直方图模式识别[J];福建电脑;2008年05期
6 曲昀卿;张永生;;图像处理与识别在车轮踏面故障检测中的应用[J];才智;2010年04期
7 郭振铎;刘洲峰;徐庆伟;朱永胜;;玻璃缺陷特征提取[J];中原工学院学报;2010年02期
8 STEVENL.TANIMOTO ,吴亮;软件工程的发展及其同模式识别和图象处理的关系[J];机器人;1984年06期
9 张大鹏;;模式识别与图象处理(PRIP)计算机发展评述[J];自动化学报;1989年01期
10 胡泽新;蒋慰孙;;基于模式识别的最优控制及应用[J];控制与决策;1992年01期
中国重要会议论文全文数据库 前10条
1 白应甫;孙茵;;地震相模式识别[A];1992年中国地球物理学会第八届学术年会论文集[C];1992年
2 谢波;冯地清;;Hopfield神经网络在核爆炸方式识别中的应用[A];第7届全国核电子学与核探测技术学术年会论文集(三)[C];1994年
3 黄雪梅;唐治德;;BP网络研究及其在肺癌诊断系统中的应用[A];电工理论与新技术2004年学术研讨会论文集[C];2004年
4 张会林;简献忠;;光电混合目标识别系统中振幅补偿匹配滤波器设计[A];2005年中国光学学会全息与光学信息处理专业委员会年会暨建会20周年纪念会[C];2005年
5 李永明;史忠科;;用模糊子集度确定模糊似然函数的二种方法[A];1998年中国智能自动化学术会议论文集(上册)[C];1998年
6 郭培源;李刚;曲世海;;基于神经网络的肉类新鲜度智能检测研究[A];2005中国控制与决策学术年会论文集(下)[C];2005年
7 颜志国;王志中;任晓梅;;独立分量分析和小波熵在动作模式分类中的应用[A];2005年上海市生物医学工程学会学术年会论文集[C];2005年
8 曾黄麟;袁曾任;;模式识别特征评选与简化的一种新方法[A];1999年中国神经网络与信号处理学术会议论文集[C];1999年
9 赵鑫;王福绵;;起重机械安全状况综合评价方法研究与新技术工程应用[A];中国力学学会学术大会'2009论文摘要集[C];2009年
10 王建;郭炳庆;陈宏志;;协同神经网络SNN的实现[A];1995年中国智能自动化学术会议暨智能自动化专业委员会成立大会论文集(上册)[C];1995年
中国重要报纸全文数据库 前10条
1 吴加录;胡启恒:科技界需要润物细无声[N];中国计算机报;2006年
2 陈瑜唐婷;让计算机会看、会听、会说、会思考[N];科技日报;2007年
3 记者 左常睿;应重视互联网模式识别的研究[N];科技日报;2005年
4 本报记者 贾婧;宗成庆:做科研也要为师立范[N];科技日报;2007年
5 河北 宁海征;常见多频彩显的模式识别与控制电路[N];电子报;2003年
6 ;通用数字视觉平台JVISION-500[N];科技日报;2003年
7 记者 刘垠;首届中美视觉夏令营开营[N];大众科技报;2009年
8 比尔·盖茨   ;新的工作世界[N];中国计算机报;2005年
9 大海 张弦;Autonomy:传统搜索终结者?[N];计算机世界;2005年
10 本报记者:段世文 ;林奇:演绎商用搜索引擎传奇[N];经济参考报;2005年
中国博士学位论文全文数据库 前10条
1 刘云鹏;电力变压器局部放电的电气定位及诊断[D];华北电力大学(河北);2005年
2 游峰;智能车辆自动换道与自动超车控制方法的研究[D];吉林大学;2005年
3 鲁绯;腐乳发酵机理、品质改进和模式识别研究[D];中国农业大学;2005年
4 程昌秀;3S技术在县级土地利用变更调查中的应用研究[D];中国农业大学;2001年
5 吴德文;遥感与地面观测数据的找矿信息提取和处理技术及应用[D];中国地质大学(北京);2006年
6 任东;基于支持向量机的植物病害识别研究[D];吉林大学;2007年
7 朱臻宇;模型传递对仪器间采样差异的评估和消除[D];第二军医大学;2005年
8 薛跃;基于RMTS的上市公司虚假财务报告识别及其扩展应用研究[D];南京理工大学;2005年
9 魏连鑫;多小波理论及其在虹膜识别技术中的应用[D];吉林大学;2006年
10 张永;基于模糊支持向量机的多类分类算法研究[D];大连理工大学;2008年
中国硕士学位论文全文数据库 前10条
1 王岩;模式识别技术在炼铁工艺优化中的应用研究[D];河北工业大学;2002年
2 李继飞;神经网络模式识别技术在自动售货机中的应用研究[D];湖南大学;2004年
3 李鸿壹;基于支持向量机的人脸检测[D];大连理工大学;2006年
4 刘兆科;多态统计模式识别模型及应用研究[D];重庆大学;2007年
5 姜斌;基于神经网络的脉象特征的研究[D];东北林业大学;2007年
6 胡莹;联机手写数学公式识别系统的研究与实现[D];广州大学;2007年
7 任杰;气管张开角的图像处理[D];江苏大学;2002年
8 牟朝强;高一函数概念学习障碍分析及教学对策研究[D];福建师范大学;2008年
9 王伟广;基于虚拟仪器的电子舌系统研究[D];东北电力大学;2009年
10 董云杰;支持向量机及其在模式识别中应用的研究[D];兰州理工大学;2003年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026