收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于XML的树型结构编码及结构相似性匹配方法

郑伟  
【摘要】:随着Internet的快速发展,网上的数据量不断增加,人们对网上信息的应用需求也不断提高。但是传统的Web信息查询大多数是基于HTML语言的,由于HTML在语义表示方面上存在一定的缺陷,导致了XML及相关技术的快速发展。如何对基于XML文档数据快速地、有效地、全面地进行信息搜索,并进一步挖掘结构及语义信息,成为人们急需解决的课题。本文针对这一问题,提出了一种对基于XML文档的树型结构进行编码的方法,采用编码形式对数据源进行信息查询,并对查询结果进行结构相似性匹配,按照用户需求检索出用户所需要的信息。为此,本文作者从以下几个方面进行研究和探讨: 首先,本文介绍了XML检索技术的发展现状,对信息检索技术的各种方法进行了回顾,简述了对基于XML文档的树型结构进行匹配的基本原理与分类。 其次,本文在分析了查询过程中的两类查询方法后,提出了一种查询方法,在保持了XML文档树型结构的基础上进行索引标记(也就是进行编码),然后进行结点查询,将满足匹配原则的结点析出,从而保持结点间的结构关系,通过文中给出的匹配度计算公式计算其匹配度,将满足用户需求的结果反馈给用户。 然后,本文通过举例分析说明了本方法的特点: 1.当数据源发生变化时,可减少重新扫描的数据量; 2.查询过程中,可以使用户清楚地了解到每一步结点信息的查询情况; 3.本文的查询方法是在查询有效结点的基础上进行结构相似性的匹配,也就是在保 证查找出用户需求信息的基础上,对这些信息的结构进行匹配,所以本方法保证了一定的查准率和查全率。 最后,本文还对树的拓扑、子树的查询与树的剪枝等问题进行了探讨,以实现智能化信息检索。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 马欢;;XML在电子商务中的应用[J];China's Foreign Trade;2011年14期
2 李恒;;元数据管理系统的研究与实现[J];电脑知识与技术;2011年13期
3 谢峰;;双XML模式在异构数据交换中的应用研究[J];黑龙江科技信息;2011年21期
4 顾锦江;;基于AS技术的计算机网络虚拟实验的开发[J];计算机应用与软件;2011年07期
5 周强;;XML在动态网页中的应用[J];科技传播;2011年15期
6 周长敏;唐型基;;XML技术在考试系统中的应用研究[J];电脑知识与技术;2011年23期
7 陈爱华;;基于XML和Web Service的异构数据库数据交换[J];武汉船舶职业技术学院学报;2011年04期
8 黎娜;张庆吉;;移动数据库同步技术及其应用[J];现代计算机(专业版);2011年10期
9 刘智琦;徐奕奕;;XML在电子商务中的应用[J];黑龙江科技信息;2011年20期
10 朱兴统;许波;;一种基于粗糙集理论的XML数据挖掘模型[J];科学技术与工程;2011年20期
11 张宗平;张咏;秦慧;;基于Web Services的数据交换平台的应用研究[J];现代计算机;2011年07期
12 李传良;;XML数据访问与数据传输优化[J];科学之友;2011年16期
13 朱兴统;;基于DOM的XML文档到关系数据库的数据转换方法[J];电脑知识与技术;2011年13期
14 曹风华;;比较分析XML与HTML[J];电脑与信息技术;2011年04期
15 晏立;沈锐;;Java序列化技术的探讨[J];红河学院学报;2011年04期
16 查文利;;基于XML的教学课件系统设计和实现[J];硅谷;2011年13期
17 兰慧红;邓欢;;基于XML的网络课件动态目录树的设计与实现[J];广西教育学院学报;2011年03期
18 纪宏伟;;基于MathML的WEB数学公式实现[J];科技经济市场;2011年07期
19 庄青青;;XML技术在数字图书馆跨库检索中的应用[J];情报探索;2011年07期
20 钱同海;彭显刚;焦悦东;;基于Web数据挖掘的节电降耗实时分析系统设计[J];电力科学与工程;2011年08期
中国重要会议论文全文数据库 前10条
1 刘德喜;吴世汉;吴通;;基于随机冲浪模型的XML文摘句子重排[A];第26届中国数据库学术会议论文集(B辑)[C];2009年
2 郭志懋;周傲英;;XML数据的在线过滤[A];第十九届全国数据库学术会议论文集(研究报告篇)[C];2002年
3 何震瀛;李建中;王宏志;;XML数据的关系存储[A];第十九届全国数据库学术会议论文集(研究报告篇)[C];2002年
4 丁峰;王煜;姚延涛;沈钧毅;;从XML模式到数据库模式[A];第十八届全国数据库学术会议论文集(技术报告篇)[C];2001年
5 谈子敬;施伯乐;;XML导出数据库表的实现与应用[A];第十八届全国数据库学术会议论文集(研究报告篇)[C];2001年
6 罗道峰;孟小峰;;一种面向XML文档的基于角色的扩展访问控制方法[A];第十八届全国数据库学术会议论文集(研究报告篇)[C];2001年
7 郑骏;王焱;钱卫宁;周傲英;;XML相似相关结构库的构造及其应用[A];第十九届全国数据库学术会议论文集(技术报告篇)[C];2002年
8 吴刚;于亚新;王国仁;于戈;;并行XML文档数据分片技术研究[A];第十九届全国数据库学术会议论文集(技术报告篇)[C];2002年
9 王静;孟小峰;王珊;;以目标节点为导向的XML路径查询处理[A];第二十届全国数据库学术会议论文集(研究报告篇)[C];2003年
10 王鹏飞;洪晓光;;基于XML大文档的动态索引[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
中国博士学位论文全文数据库 前10条
1 汪陈应;XML数据编码与存储管理关键技术研究[D];南开大学;2010年
2 沈洁;基于自动机的XML数据过滤研究[D];哈尔滨工程大学;2010年
3 殷丽凤;不完全信息环境下XML数据库规范化问题的研究[D];哈尔滨理工大学;2009年
4 叶晓峰;基于XML的冲压模具设计知识重用技术研究[D];华中科技大学;2010年
5 张晨静;XML关键字过滤技术[D];复旦大学;2011年
6 汪源;XML事务模型及并发控制研究[D];浙江大学;2006年
7 许建军;对结构化和半结构化数据的关键字搜索研究[D];复旦大学;2007年
8 彭城;蛋白质构象转换的构象采样与结构分析研究[D];上海交通大学;2011年
9 刘喜平;XML文档搜索中的查询处理技术研究[D];江西财经大学;2010年
10 李荷华;面向智能体的化工过程运行系统信息集成模型研究[D];华南理工大学;2003年
中国硕士学位论文全文数据库 前10条
1 朱杰;基于主题和结构的XML网页的数据抽取[D];华侨大学;2005年
2 刘靖超;面向数据采集的信息集成系统设计与实现[D];河北工业大学;2005年
3 王旭磊;基于CBR的电子商务网站智能设计系统的研究[D];青岛大学;2005年
4 李志明;基于Web服务的在线考试系统应用研究与实现[D];广东工业大学;2005年
5 江静;基于XML的公文管理系统设计与应用研究[D];南京理工大学;2005年
6 陈美云;基于XML的柔性信息集成技术研究[D];山东科技大学;2005年
7 朱瑜;工作流引擎研究与实现[D];电子科技大学;2005年
8 谢红;XML技术和B/S模式在职业教育与培训管理信息系统中的应用研究[D];重庆大学;2005年
9 郦金花;基于XML的MARC发布系统的设计与实现[D];苏州大学;2005年
10 沈剑沧;XML查询方法研究[D];华东师范大学;2006年
中国重要报纸全文数据库 前10条
1 秦林;《XML完全探索》[N];中华读书报;2001年
2 本报记者 李瀛寰;XML推了网络一把[N];中国计算机报;2000年
3 ;分化并不能阻止XML发展[N];中国计算机报;2000年
4 ;为XML标准定标准[N];中国计算机报;2001年
5 IDG电讯;Microsoft、IBM共同制定XML标准[N];计算机世界;2000年
6 北京邮电大学 张剑;XML与HTML的结合(上)[N];计算机世界;2001年
7 本报记者 陆 杰;XML丛林的新秀[N];中华读书报;2002年
8 北京邮电大学 张剑;XML与HTML的结合(下)[N];计算机世界;2001年
9 侯青;国际电子商务XML/EDI特点及现状[N];国际商报;2001年
10 北京邮电大学 张剑;XML技术预览[N];计算机世界;2001年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978