收藏本站
《哈尔滨工程大学》 2006年
收藏 | 手机打开
二维码
手机客户端打开本文

XML内容路由关键技术研究

王桐  
【摘要】: 随着信息高速公路的发展,互联网上出现了大量采用事件-驱动模式的应用,如主动服务中的发布订阅系统、基于内容的XML路由、XML文档分发以及新闻传递等。这类应用中,信息以XML流的形式由一系列生产者经过事件代理传递到另一些消费者手中;消费者通过过滤引擎进行订阅。由于仅与XML的内容本身有关,而与信息在何处发布无关,这种路由方式常被称作内容路由。然而,现有的内容路由技术在高效匹配算法、对异构事件处理等方面尚存一些问题。 扩展标记语言XML作为一种数据表示和交换的标准,具有自描述性、可扩展性、利于异构数据交换等诸多优点。本文以XML为事件模型、XPath作为多用户订阅模型来研究内容路由的若干关键技术。 本文提出了一种基于hedge文法的HXFA机来处理XML发布流事件,并给出了HXFA机的过滤优化算法及算法正确性分析。最后,将多个HXFA机合并作为系统的过滤引擎。从算法的效率和可扩展性方面进行实验分析,提出的方法优于著名的内容过滤引擎YFilter。 分析了现有XML相似性模型的优缺点,针对这些模型的不足,扩展了向量空间模型,提出了基于语义和支持度的层次路径模型,并给出其生成算法及复杂度分析。模型首先挖掘文档集中频繁出现的路径,通过文档中的语义信息来合并重复节点、路径,同时对文档特征向量进行维数规约。最后给出基于语义和支持度的距离测度方法。该方法兼顾了XML文档的结构信息和语义信息两个方面的相似性。与树编辑距离模型相比,不但每个文档具有“类原型”描述,而且在时间开销上有较大优势。 根据H path模型,提出一种基于改进粒子群优化的XML文档聚类方法。首先将文档集映射到粒子群模型问题空间,然后利用粒子群聚类方法进行聚类,最终权衡了时间和准确性两方面因素,进一步提出混合的粒子群聚类方法,增强了聚类收敛程度和准确程度。 尽管提出的模型在提取时已进行了数据归约,然而对于冗余的、异构的XML文档而言,高维灾难问题仍然存在。针对此问题,提出一种独立分量分析的预分类方法。该方法首先对文档矩阵进行维数归约,随后在独立分量张成的空间中进行聚类分析。采用本方法有两个优点:第一,去除相关冗余,挖掘更具有区分能力的特性并尽量刻画潜在的数据分布,从而增加聚类准确性。第二,通过有效降低向量空间的维数,大大压缩了搜索空间规模,减小开销。 最后,提出了一个支持异构事件处理的XML发布/订阅系统体系结构。该系统反应了本研究中提出的内容路由技术是如何应用的。
【学位授予单位】:哈尔滨工程大学
【学位级别】:博士
【学位授予年份】:2006
【分类号】:TP312.2

手机知网App
【引证文献】
中国博士学位论文全文数据库 前2条
1 沈洁;基于自动机的XML数据过滤研究[D];哈尔滨工程大学;2010年
2 胡文生;XML数据流上基于窗口的查询处理方法研究[D];武汉大学;2012年
【参考文献】
中国期刊全文数据库 前10条
1 游荣义,陈忠;一种基于ICA的盲信号分离快速算法[J];电子学报;2004年04期
2 张忠平,王超,朱扬勇;基于约束的XML文档规范化算法[J];计算机研究与发展;2005年05期
3 路燕;郝忠孝;张亮;;一种DTDs完全一致性判断算法[J];计算机研究与发展;2005年11期
4 郑仕辉,周傲英,张龙;XML文档的相似测度和结构索引研究[J];计算机学报;2003年09期
5 宋擒豹,沈钧毅;基于关联规则的Web文档聚类算法[J];软件学报;2002年03期
6 陈宁,陈安,周龙骧,贾维嘉,罗三定;基于模糊概念图的文档聚类及其在Web中的应用[J];软件学报;2002年08期
7 吕建华,王国仁,于戈;XML数据的路径表达式查询优化技术[J];软件学报;2003年09期
8 岳昆,王晓玲,周傲英;Web服务核心支撑技术:研究综述[J];软件学报;2004年03期
9 孟小峰,罗道锋,蒋瑜,王宇;OreintXA:一种有效的XQuery查询代数[J];软件学报;2004年11期
10 孟小峰,周龙骧,王珊;数据库技术发展趋势[J];软件学报;2004年12期
中国博士学位论文全文数据库 前1条
1 张忠平;基于约束的XML数据库模式规范化研究[D];复旦大学;2004年
【共引文献】
中国期刊全文数据库 前10条
1 高志升,刘兴伟;基于语义P2P的Web服务模型[J];阿坝师范高等专科学校学报;2005年03期
2 王红艳;朱全银;丁甜甜;;通信终端与农村科技服务平台的Web服务数据同步设计[J];安徽农业科学;2012年01期
3 方芳;叶春明;;基于Qos的语义Web服务发现研究[J];安庆师范学院学报(自然科学版);2010年02期
4 侯贵法;罗颖;;基于SOA的数字气田应用集成[J];安阳工学院学报;2007年04期
5 曹利培;杨庆祥;李冰川;;一种考虑QoS的网格服务匹配模型[J];安阳工学院学报;2009年02期
6 王宏鼎;谭少华;唐世渭;杨冬青;童云海;;基于模式元素语义关系的模式合并方法研究[J];北京大学学报(自然科学版)网络版(预印本);2006年04期
7 刘玫瑾;;体育人才数据库的设计与应用[J];办公自动化;2008年22期
8 刘实;刘书雷;熊伟;钟志农;;基于工作流的服务动态聚合平台[J];兵工自动化;2007年10期
9 王宏鼎;谭少华;唐世渭;杨冬青;童云海;;基于模式元素语义关系的模式合并方法研究[J];北京大学学报(自然科学版);2007年03期
10 方丽英;王普;闫健卓;;面向语义异构的信息集成系统查询处理方案[J];北京工业大学学报;2007年08期
中国重要会议论文全文数据库 前10条
1 陶冶;刘建勋;唐明董;;基于Map/Reduce的分布式Web服务搜索引擎设计与实现[A];CCF NCSC 2011——第二届中国计算机学会服务计算学术会议论文集[C];2011年
2 党德鹏;徐俏;徐娟;;基于替代的Web服务事务提交协议及其性能分析[A];CCF NCSC 2011——第二届中国计算机学会服务计算学术会议论文集[C];2011年
3 陈彦萍;李增智;夏虹;朱海萍;;服务质量驱动的Web服务组合框架的设计与实现[A];2006年全国通信软件学术会议论文集[C];2006年
4 李宏伟;李勤超;蔡畅;;基于OWL-S的地理信息服务语义描述研究[A];中国地理信息系统协会第四次会员代表大会暨第十一届年会论文集[C];2007年
5 薛海丽;樊永生;韩燮;;下一代网络结构和关键技术分析[A];AECC专题学术研讨会论文集[C];2007年
6 张艳梅;;基于Overlay网络的服务组合研究综述[A];2006北京地区高校研究生学术交流会——通信与信息技术会议论文集(上)[C];2006年
7 陆斌;骆志刚;苏光龙;丁凡;;RNA序列结构比对算法综述[A];中国电子学会第十六届信息论学术年会论文集[C];2009年
8 董燕;;中央监测资源集成平台的软件架构设计思路[A];中国新闻技术工作者联合会2008年学术年会论文集(下)[C];2008年
9 吴家菊;刘刚;席传裕;;Web服务数据的二次处理[A];第二届全国信息与电子工程学术交流会暨第十三届四川省电子学会曙光分会学术年会论文集[C];2006年
10 陈龙彪;李石坚;潘纲;;基于SOA的智能车情境感知与服务系统[A];第六届和谐人机环境联合学术会议(HHME2010)、第19届全国多媒体学术会议(NCMT2010)、第6届全国人机交互学术会议(CHCI2010)、第5届全国普适计算学术会议(PCC2010)论文集[C];2010年
中国博士学位论文全文数据库 前10条
1 孟宇龙;基于本体的多源异构安全数据聚合[D];哈尔滨工程大学;2010年
2 朱里越;多业务协同系统服务组合技术研究[D];中国科学技术大学;2010年
3 殷丽凤;不完全信息环境下XML数据库规范化问题的研究[D];哈尔滨理工大学;2009年
4 蔺旭东;基于语义的XML查询及规范化研究[D];北京交通大学;2010年
5 高瞻;网格任务调度中服务质量保证相关问题研究[D];北京交通大学;2010年
6 尹可挺;Internet环境中基于QoS的Web服务组合研究[D];浙江大学;2010年
7 邝砾;基于接口和行为语义的Web服务发现与适配研究[D];浙江大学;2009年
8 王强;空间信息服务聚合的关键技术研究[D];解放军信息工程大学;2010年
9 付晓东;Web服务组合服务质量保障关键问题研究[D];昆明理工大学;2008年
10 吴斌;企业服务总线中动态服务路由技术的研究[D];山东大学;2010年
中国硕士学位论文全文数据库 前10条
1 程妍妍;基于嵌套Spreadsheet和数据流的多模态的Mashup应用构造[D];山东科技大学;2010年
2 吕媛媛;基于本体的物流信息集成系统的研究[D];山东科技大学;2010年
3 杨建英;基于P2P和VNC的测井解释协同平台的研究与实现[D];山东科技大学;2010年
4 许斌;数据库通知服务的研究与实现[D];山东科技大学;2010年
5 夏光磊;关于XML的关系数据库存储查询技术研究[D];山东科技大学;2010年
6 聂剑锋;基于QoS的Web服务选择研究[D];浙江理工大学;2010年
7 白林;基于路径表达式的XML索引查询技术[D];郑州大学;2010年
8 宋超臣;基于推荐网络的服务搜索技术研究[D];哈尔滨工程大学;2010年
9 戴步成;基于ArcGIS Server的电子地图研究及应用[D];大连理工大学;2010年
10 程波波;基于文本的茶学本体学习方法研究[D];安徽农业大学;2010年
【同被引文献】
中国期刊全文数据库 前10条
1 李新叶;苑津莎;;一种快速的XML语义检索算法[J];电子学报;2007年11期
2 胡勤友,胡运发;基于扩展路径表达式的XML查询[J];计算机研究与发展;2003年05期
3 高军,杨冬青,王腾蛟,唐世渭;一种XML数据流之上持续查询执行器的增量维护方法[J];计算机研究与发展;2005年05期
4 金鑫;金远平;;一种改进的基于约束关系的XML查询重写算法研究[J];计算机研究与发展;2007年05期
5 姚佳丽;张坤龙;王珊;;基于P2P的数据索引与查询[J];计算机科学;2005年03期
6 孙东海;张昱;吴晓勇;;XML流上的XQuery前缀共享查询[J];计算机科学;2007年10期
7 朱茂盛,许英华;一种新的基于有限自动机的XML过滤方法[J];计算机工程;2004年24期
8 吴晓勇;张昱;孙东海;;XQuery在XML流上查询的结构化连接[J];计算机工程;2008年04期
9 徐德智,吴敏;XML自动机的构造及实用化研究[J];计算机学报;2003年04期
10 郑仕辉,周傲英,张龙;XML文档的相似测度和结构索引研究[J];计算机学报;2003年09期
中国博士学位论文全文数据库 前10条
1 张忠平;基于约束的XML数据库模式规范化研究[D];复旦大学;2004年
2 雷向欣;XML索引和过滤查询若干关键技术研究[D];复旦大学;2005年
3 徐德智;XML数据库查询及其模式集成研究[D];中南大学;2004年
4 孙伟;XML数据库查询优化及相关技术研究[D];哈尔滨工程大学;2006年
5 李晓光;XML非完全结构查询处理中若干关键技术的研究[D];东北大学;2006年
6 朱茂盛;XML路径表达式优化及其查询和过滤计算方法[D];中国科学院研究生院(计算技术研究所);2004年
7 王静;XML路径查询处理关键技术研究[D];中国科学院研究生院(计算技术研究所);2003年
8 梁作鹏;面向Web的XML检索关键技术研究[D];东南大学;2005年
9 宫学庆;基于Bloom Filter的路径表达式查询处理[D];复旦大学;2006年
10 韩忠明;基于XML的数据查询和信息检索集成化系统研究[D];东华大学;2006年
中国硕士学位论文全文数据库 前1条
1 崔敏;基于lazyDFA的XML数据流查询处理及优化技术研究[D];内蒙古科技大学;2008年
【二级参考文献】
中国期刊全文数据库 前9条
1 刘健庄,谢维信,黄建军,李文化;聚类分析的遗传算法方法[J];电子学报;1995年11期
2 孟小峰;Web数据管理研究综述[J];计算机研究与发展;2001年04期
3 丁治明,孟小峰,白芸,丁锐;基于关系数据库的位置相关查询处理[J];计算机研究与发展;2004年03期
4 王国仁,于戈,张斌,郑怀远;面向对象数据库系统中的谓词选择率估算[J];计算机学报;1998年S1期
5 孟小峰;Web信息集成技术研究[J];计算机应用与软件;2003年11期
6 叶秀清;顾伟康;肖强;;快速模糊分割算法[J];模式识别与人工智能;1996年01期
7 丁震;胡钟山;杨静宇;唐振民;邬永革;;一种适用于灰度图像分割的快速FCM算法[J];模式识别与人工智能;1997年02期
8 谈子敬,庞引明,施伯乐;XML上的函数依赖推理[J];软件学报;2003年09期
9 高军,杨冬青,唐世渭,王腾蛟;一种基于DTD的XPath逻辑优化方法[J];软件学报;2004年12期
【相似文献】
中国期刊全文数据库 前10条
1 郑淮宇;吴健;;基于XML和Web服务的数据交换共享研究[J];微处理机;2008年04期
2 喻剑;赖晓铮;赖声礼;;RFID中间件消息分发系统(英文)[J];科学技术与工程;2010年03期
3 王桐;刘大昕;;一种新的混合XML文档聚类方法[J];哈尔滨工程大学学报;2007年06期
4 廖小平;王志坚;刘山;;基于XML和发布/订阅机制的主动服务系统[J];计算机应用与软件;2009年01期
5 廖小平;王志坚;刘山;;基于XML的发布/订阅型系统中过滤算法的改进[J];电脑开发与应用;2008年12期
6 吴於茜;在平面设计软件中实现SVG格式文档输出[J];计算机工程与应用;2001年09期
7 张伟都,周海东,钟共鸣,张素伟;面向XML的数据管理系统[J];计算机工程与应用;2001年20期
8 李天庆,张毅,张冰,胡东成;基于XML的体育数据规格化存储技术研究[J];计算机工程与应用;2001年22期
9 张晓林;基于XML的信息组织与处理:1.XML技术体系[J];情报科学;2001年08期
10 李慧,何绍华;XML在图书馆系统中的实现技术[J];现代图书情报技术;2001年04期
中国重要会议论文全文数据库 前10条
1 郭志懋;周傲英;;XML数据的在线过滤[A];第十九届全国数据库学术会议论文集(研究报告篇)[C];2002年
2 何震瀛;李建中;王宏志;;XML数据的关系存储[A];第十九届全国数据库学术会议论文集(研究报告篇)[C];2002年
3 丁峰;王煜;姚延涛;沈钧毅;;从XML模式到数据库模式[A];第十八届全国数据库学术会议论文集(技术报告篇)[C];2001年
4 谈子敬;施伯乐;;XML导出数据库表的实现与应用[A];第十八届全国数据库学术会议论文集(研究报告篇)[C];2001年
5 罗道峰;孟小峰;;一种面向XML文档的基于角色的扩展访问控制方法[A];第十八届全国数据库学术会议论文集(研究报告篇)[C];2001年
6 郑骏;王焱;钱卫宁;周傲英;;XML相似相关结构库的构造及其应用[A];第十九届全国数据库学术会议论文集(技术报告篇)[C];2002年
7 吴刚;于亚新;王国仁;于戈;;并行XML文档数据分片技术研究[A];第十九届全国数据库学术会议论文集(技术报告篇)[C];2002年
8 王静;孟小峰;王珊;;以目标节点为导向的XML路径查询处理[A];第二十届全国数据库学术会议论文集(研究报告篇)[C];2003年
9 王鹏飞;洪晓光;;基于XML大文档的动态索引[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
10 肖冰;廖湖声;郑玉明;;数据集成系统中的XML延迟处理技术[A];第二十二届中国数据库学术会议论文集(研究报告篇)[C];2005年
中国重要报纸全文数据库 前10条
1 秦林;《XML完全探索》[N];中华读书报;2001年
2 本报记者 李瀛寰;XML推了网络一把[N];中国计算机报;2000年
3 ;分化并不能阻止XML发展[N];中国计算机报;2000年
4 ;为XML标准定标准[N];中国计算机报;2001年
5 IDG电讯;Microsoft、IBM共同制定XML标准[N];计算机世界;2000年
6 北京邮电大学 张剑;XML与HTML的结合(上)[N];计算机世界;2001年
7 本报记者 陆 杰;XML丛林的新秀[N];中华读书报;2002年
8 侯青;国际电子商务XML/EDI特点及现状[N];国际商报;2001年
9 北京邮电大学 张剑;XML技术预览[N];计算机世界;2001年
10 北京邮电大学 张剑;XML与HTML的结合(下)[N];计算机世界;2001年
中国博士学位论文全文数据库 前10条
1 王桐;XML内容路由关键技术研究[D];哈尔滨工程大学;2006年
2 窦全胜;求解优化问题的演化计算方法研究[D];吉林大学;2005年
3 刘丽;人工免疫网络研究及应用[D];江南大学;2008年
4 李磊;六自由度并联平台位置正解及控制方法研究[D];哈尔滨工程大学;2008年
5 马瑞新;基于粒子群的网络社区动态角色挖掘研究[D];大连理工大学;2012年
6 陈虹;分离流动的电磁力主动控制[D];华中科技大学;2011年
7 林川;粒子群优化与差分进化算法研究及其应用[D];西南交通大学;2009年
8 沈洁;基于自动机的XML数据过滤研究[D];哈尔滨工程大学;2010年
9 叶晓峰;基于XML的冲压模具设计知识重用技术研究[D];华中科技大学;2010年
10 殷丽凤;不完全信息环境下XML数据库规范化问题的研究[D];哈尔滨理工大学;2009年
中国硕士学位论文全文数据库 前10条
1 雷烨;基于粒子群最小二乘支持向量机的故障诊断算法研究[D];兰州交通大学;2010年
2 马培培;基于粒子群的图像阈值化分割的研究及应用[D];合肥工业大学;2010年
3 姚杰;基于PSO混沌神经网络电力系统负荷预测[D];大庆石油学院;2009年
4 朱杰;基于主题和结构的XML网页的数据抽取[D];华侨大学;2005年
5 周晓宁;基于工作流的信息集成在客户信息管理中的应用研究[D];南京航空航天大学;2005年
6 刘靖超;面向数据采集的信息集成系统设计与实现[D];河北工业大学;2005年
7 王旭磊;基于CBR的电子商务网站智能设计系统的研究[D];青岛大学;2005年
8 杜鹃;面向长春市地理信息系统的语义网模型研究[D];吉林大学;2005年
9 周金凤;基于CELTS标准的教育资源管理系统的设计与开发[D];华中师范大学;2005年
10 谢翠萍;基于Web服务以内容管理为中心的企业应用集成研究[D];广东工业大学;2005年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026