收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

XML内容路由关键技术研究

王桐  
【摘要】: 随着信息高速公路的发展,互联网上出现了大量采用事件-驱动模式的应用,如主动服务中的发布订阅系统、基于内容的XML路由、XML文档分发以及新闻传递等。这类应用中,信息以XML流的形式由一系列生产者经过事件代理传递到另一些消费者手中;消费者通过过滤引擎进行订阅。由于仅与XML的内容本身有关,而与信息在何处发布无关,这种路由方式常被称作内容路由。然而,现有的内容路由技术在高效匹配算法、对异构事件处理等方面尚存一些问题。 扩展标记语言XML作为一种数据表示和交换的标准,具有自描述性、可扩展性、利于异构数据交换等诸多优点。本文以XML为事件模型、XPath作为多用户订阅模型来研究内容路由的若干关键技术。 本文提出了一种基于hedge文法的HXFA机来处理XML发布流事件,并给出了HXFA机的过滤优化算法及算法正确性分析。最后,将多个HXFA机合并作为系统的过滤引擎。从算法的效率和可扩展性方面进行实验分析,提出的方法优于著名的内容过滤引擎YFilter。 分析了现有XML相似性模型的优缺点,针对这些模型的不足,扩展了向量空间模型,提出了基于语义和支持度的层次路径模型,并给出其生成算法及复杂度分析。模型首先挖掘文档集中频繁出现的路径,通过文档中的语义信息来合并重复节点、路径,同时对文档特征向量进行维数规约。最后给出基于语义和支持度的距离测度方法。该方法兼顾了XML文档的结构信息和语义信息两个方面的相似性。与树编辑距离模型相比,不但每个文档具有“类原型”描述,而且在时间开销上有较大优势。 根据H path模型,提出一种基于改进粒子群优化的XML文档聚类方法。首先将文档集映射到粒子群模型问题空间,然后利用粒子群聚类方法进行聚类,最终权衡了时间和准确性两方面因素,进一步提出混合的粒子群聚类方法,增强了聚类收敛程度和准确程度。 尽管提出的模型在提取时已进行了数据归约,然而对于冗余的、异构的XML文档而言,高维灾难问题仍然存在。针对此问题,提出一种独立分量分析的预分类方法。该方法首先对文档矩阵进行维数归约,随后在独立分量张成的空间中进行聚类分析。采用本方法有两个优点:第一,去除相关冗余,挖掘更具有区分能力的特性并尽量刻画潜在的数据分布,从而增加聚类准确性。第二,通过有效降低向量空间的维数,大大压缩了搜索空间规模,减小开销。 最后,提出了一个支持异构事件处理的XML发布/订阅系统体系结构。该系统反应了本研究中提出的内容路由技术是如何应用的。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 郑淮宇;吴健;;基于XML和Web服务的数据交换共享研究[J];微处理机;2008年04期
2 喻剑;赖晓铮;赖声礼;;RFID中间件消息分发系统(英文)[J];科学技术与工程;2010年03期
3 王桐;刘大昕;;一种新的混合XML文档聚类方法[J];哈尔滨工程大学学报;2007年06期
4 廖小平;王志坚;刘山;;基于XML和发布/订阅机制的主动服务系统[J];计算机应用与软件;2009年01期
5 廖小平;王志坚;刘山;;基于XML的发布/订阅型系统中过滤算法的改进[J];电脑开发与应用;2008年12期
6 吴於茜;在平面设计软件中实现SVG格式文档输出[J];计算机工程与应用;2001年09期
7 张伟都,周海东,钟共鸣,张素伟;面向XML的数据管理系统[J];计算机工程与应用;2001年20期
8 李天庆,张毅,张冰,胡东成;基于XML的体育数据规格化存储技术研究[J];计算机工程与应用;2001年22期
9 张晓林;基于XML的信息组织与处理:1.XML技术体系[J];情报科学;2001年08期
10 李慧,何绍华;XML在图书馆系统中的实现技术[J];现代图书情报技术;2001年04期
11 谈春梅,段卫华,田质斌;标准文献数据库系统的设计与实现[J];现代图书情报技术;2001年06期
12 李景春,武港山,张福炎;基于转换的光盘文档库数据生成和浏览[J];小型微型计算机系统;2001年04期
13 周建洪,吴以群,庞引明,楼荣生;XML文件系统的设计[J];计算机工程与科学;2001年02期
14 袁琳,李秉严;SGML、HTML、XML的比较[J];四川图书馆学报;2001年03期
15 曹向东;基于JSP的数据访问技术[J];中国民航学院学报;2001年04期
16 李效东,顾毓清;基于DOM的Web信息提取[J];计算机学报;2002年05期
17 李军怀,周明全,耿国华,张景西;XML在异构数据集成中的应用研究[J];计算机应用;2002年09期
18 文燕平,周宁;WWW中的XML数据管理研究[J];情报科学;2002年06期
19 尹桂秀;XML搜索引擎探微[J];图书情报工作;2002年03期
20 肖延松,孟波,熊德林,杨子晨;基于XML的数据交换在分布式Web系统中的应用[J];计算机系统应用;2002年03期
中国重要会议论文全文数据库 前10条
1 郭志懋;周傲英;;XML数据的在线过滤[A];第十九届全国数据库学术会议论文集(研究报告篇)[C];2002年
2 何震瀛;李建中;王宏志;;XML数据的关系存储[A];第十九届全国数据库学术会议论文集(研究报告篇)[C];2002年
3 丁峰;王煜;姚延涛;沈钧毅;;从XML模式到数据库模式[A];第十八届全国数据库学术会议论文集(技术报告篇)[C];2001年
4 谈子敬;施伯乐;;XML导出数据库表的实现与应用[A];第十八届全国数据库学术会议论文集(研究报告篇)[C];2001年
5 罗道峰;孟小峰;;一种面向XML文档的基于角色的扩展访问控制方法[A];第十八届全国数据库学术会议论文集(研究报告篇)[C];2001年
6 郑骏;王焱;钱卫宁;周傲英;;XML相似相关结构库的构造及其应用[A];第十九届全国数据库学术会议论文集(技术报告篇)[C];2002年
7 吴刚;于亚新;王国仁;于戈;;并行XML文档数据分片技术研究[A];第十九届全国数据库学术会议论文集(技术报告篇)[C];2002年
8 王静;孟小峰;王珊;;以目标节点为导向的XML路径查询处理[A];第二十届全国数据库学术会议论文集(研究报告篇)[C];2003年
9 王鹏飞;洪晓光;;基于XML大文档的动态索引[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
10 肖冰;廖湖声;郑玉明;;数据集成系统中的XML延迟处理技术[A];第二十二届中国数据库学术会议论文集(研究报告篇)[C];2005年
中国博士学位论文全文数据库 前10条
1 王桐;XML内容路由关键技术研究[D];哈尔滨工程大学;2006年
2 窦全胜;求解优化问题的演化计算方法研究[D];吉林大学;2005年
3 刘丽;人工免疫网络研究及应用[D];江南大学;2008年
4 李磊;六自由度并联平台位置正解及控制方法研究[D];哈尔滨工程大学;2008年
5 马瑞新;基于粒子群的网络社区动态角色挖掘研究[D];大连理工大学;2012年
6 陈虹;分离流动的电磁力主动控制[D];华中科技大学;2011年
7 林川;粒子群优化与差分进化算法研究及其应用[D];西南交通大学;2009年
8 沈洁;基于自动机的XML数据过滤研究[D];哈尔滨工程大学;2010年
9 叶晓峰;基于XML的冲压模具设计知识重用技术研究[D];华中科技大学;2010年
10 殷丽凤;不完全信息环境下XML数据库规范化问题的研究[D];哈尔滨理工大学;2009年
中国硕士学位论文全文数据库 前10条
1 雷烨;基于粒子群最小二乘支持向量机的故障诊断算法研究[D];兰州交通大学;2010年
2 马培培;基于粒子群的图像阈值化分割的研究及应用[D];合肥工业大学;2010年
3 姚杰;基于PSO混沌神经网络电力系统负荷预测[D];大庆石油学院;2009年
4 朱杰;基于主题和结构的XML网页的数据抽取[D];华侨大学;2005年
5 周晓宁;基于工作流的信息集成在客户信息管理中的应用研究[D];南京航空航天大学;2005年
6 刘靖超;面向数据采集的信息集成系统设计与实现[D];河北工业大学;2005年
7 王旭磊;基于CBR的电子商务网站智能设计系统的研究[D];青岛大学;2005年
8 杜鹃;面向长春市地理信息系统的语义网模型研究[D];吉林大学;2005年
9 周金凤;基于CELTS标准的教育资源管理系统的设计与开发[D];华中师范大学;2005年
10 谢翠萍;基于Web服务以内容管理为中心的企业应用集成研究[D];广东工业大学;2005年
中国重要报纸全文数据库 前10条
1 秦林;《XML完全探索》[N];中华读书报;2001年
2 本报记者 李瀛寰;XML推了网络一把[N];中国计算机报;2000年
3 ;分化并不能阻止XML发展[N];中国计算机报;2000年
4 ;为XML标准定标准[N];中国计算机报;2001年
5 IDG电讯;Microsoft、IBM共同制定XML标准[N];计算机世界;2000年
6 北京邮电大学 张剑;XML与HTML的结合(上)[N];计算机世界;2001年
7 本报记者 陆 杰;XML丛林的新秀[N];中华读书报;2002年
8 侯青;国际电子商务XML/EDI特点及现状[N];国际商报;2001年
9 北京邮电大学 张剑;XML技术预览[N];计算机世界;2001年
10 北京邮电大学 张剑;XML与HTML的结合(下)[N];计算机世界;2001年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978