收藏本站
《西北工业大学》 2002年
收藏 | 手机打开
二维码
手机客户端打开本文

基于XML的半结构数据管理及数据集成问题研究

聂培尧  
【摘要】: 近年来,随着WWW(World Wide Web)的迅猛发展,半结构数据的管理与集成已成为数据库领域中的一个十分重要的研究方向。特别是XML(eXtensible Markup Language)作为一种新的数据交换事实上的标准,使得WWW上的数据交换和集成成为可能。XML另一个使人感到振奋的是,它的出现将会“把Web变成数据库”。将Web上的半结构数据迁移到XML上是对WWW上巨大数据进行有效管理的一项十分有意义的工作。因而,基于XML的半结构数据管理与集成问题的研究目前已成为国际数据库界的一个重要研究方向之一。 本文对基于XML的半结构数据的管理及集成进行了较为全面而深入的研究和探讨,包括基于XML的半结构数据模型、查询语言、模式发现及抽取、视图机制、XML半结构数据的存储以及数据集成等问题。本文反映了作者自1999年以来的主要研究成果,包括以下内容: 一、在基于XML的半结构数据模型的研究上,首先提出了一种类LISP语言的半结构数据的句法描述形式。使用该句法,可以将半结构数据的描述统一到一种形式化的方法上。本文还对XML数据与半结构数据之间的关系进行了研究,并在此基础上提出了一种带有性质(Property)的基于XML的半结构数据模型,同时给出了将XML数据映象到带有性质的半结构数据模型上的算法,从而将半结构数据中的元数据(性质)与XML文档中元素的属性统一起来。 二、给出了半结构数据查询语言的评价准则。基于这些准则,对一个简单的半结构数据查询核心语言的语法提出了两方面扩充;给出了计算数据图中正规表达式的算法;对半结构数据查询语言的一阶逻辑描述、结构递归和数据图的双态仿真(Bisimulation)等问题进行了研究,提出了一种判定数据图的Bisimulation算法;在XML数据查询语言研究的基础上,设计并实现了一种具有数据库查询特性的Web查询系统原型。 三、对半结构数据的类型及模式的描述形式进行了研究,并分别给出了使用最大不动点语义计算半结构数据类型划分的算法思想和最大仿真(Simulation)计算方法的思想。本文还对模式的抽取及XML模式的描述形式进行了研究,提出了使用Simulation算法抽取Datalog规则的算法思想和基于OEM(Object Exchange Model)的XML DTD模式的形式描述方法。 四、对半结构数据的视图机制进行了研究,并就半结构数据的虚拟视图和实视图(物化视图)维护困难的问题给出了一些解决策略;提出了一种用于异构 西北工业大学博士学住论文 一 数据源或Web数据集成系统环境的XML视图的体系结构,并就该体系结构中的 各主要组成部分进行了论述。 五、对基于XML的半结构数据集成所涉及到的若干问题进行了研究,对三 种**L数据的存储方法进行了深入分析和比较,提出井实现了一种**L数掂 的OapB存储策略;对数据源上的分布查询计算及数据融合问题进行了研究, 给出了一种减少WWW站点间通信量、提高查询计算效率的分布查询计算策略; 提出并实现了一种可动态配置的、基于XML的半结构数据集成用的数据包装器 (Wrapper)的原型系统。 本文中的部分研究工作得到了国家自然科学基金及山东省教育厅第二批科 研发展计划项目的资助。
【学位授予单位】:西北工业大学
【学位级别】:博士
【学位授予年份】:2002
【分类号】:TP393.03

知网文化
【引证文献】
中国期刊全文数据库 前1条
1 蔡琼;罗雪松;;HITS算法在Web挖掘中的应用与改进[J];软件导刊;2008年02期
中国博士学位论文全文数据库 前2条
1 梁平;面向产品生命周期数据的XML本源数据库的研究[D];合肥工业大学;2006年
2 杨骏;“数字城市”中的空间本体数据库研究[D];西南交通大学;2007年
中国硕士学位论文全文数据库 前10条
1 王强;基于演示编程的遥感图像元数据提取方法研究[D];山东科技大学;2010年
2 商翠珍;数据资源汇聚的可视化建模技术研究与应用[D];山东科技大学;2010年
3 夏怀楠;支持跨域数据汇聚的关系数据访问服务研究[D];山东科技大学;2010年
4 沈迅;基于Web页面嵌套模式的包装器生成系统的设计与实现[D];北京邮电大学;2010年
5 郭玉珂;XML面向对象数据模型研究及应用[D];中南大学;2005年
6 石宇;基于XML的Web信息抽取与集成技术的研究[D];大连海事大学;2006年
7 闰伟;电子政务信息资源元数据库的研究与应用[D];东华大学;2006年
8 杨莉;异构数据源集成技术在UDC项目中的应用研究[D];兰州大学;2006年
9 王化鹏;基于XML的Web日志挖掘技术研究[D];华北电力大学(河北);2007年
10 丁娟;基于XML的Web内容挖掘应用研究[D];华北电力大学(河北);2007年
【参考文献】
中国期刊全文数据库 前1条
1 王宁,陈滢,俞本权,徐宏炳,王能斌;一个基于CORBA的异构数据源集成系统的设计[J];软件学报;1998年05期
【共引文献】
中国期刊全文数据库 前10条
1 王宏宇;;基于Native-XML数据库倒排索引算法研究[J];情报科学;2006年07期
2 黄文;XML技术及其在数字图书馆中的应用[J];情报理论与实践;2003年01期
3 黄晓斌;网络信息组织中超文本链接的优化[J];情报理论与实践;2003年03期
4 周朴雄;基于本体论的语义信息模型[J];情报理论与实践;2004年02期
5 朱超;关于元数据互操作的探讨[J];情报理论与实践;2005年06期
6 王操;;一种解决分布式异构信息资源整合的方法研究[J];情报理论与实践;2011年03期
7 邓凯,吴家春,王洪伟;基于XML的移动数字图书服务体系结构研究[J];情报学报;2002年05期
8 文燕平,张玉峰;面向对象的Web查询语言研究[J];情报杂志;2002年01期
9 宿世明;网上文献信息挖掘整合[J];情报杂志;2004年04期
10 余波;基于XML的商品信息描述标准[J];情报杂志;2005年11期
中国重要会议论文全文数据库 前10条
1 游文杰;;用Javascript实现XML文档数据检索[A];福建师大福清分校2003年会议论文汇编[C];2003年
2 闵阳;刘建华;;基于XML的分布式WebGIS模型研究[A];全国测绘科技信息网中南分网第二十一次学术信息交流会论文集[C];2007年
3 陶惠良;杨正球;;基于Struts+Spring的易维护软件流程设计与实现[A];2009年中国高校通信类院系学术研讨会论文集[C];2009年
4 张晶;张云生;;基于XML的实时数据一致性查询机制[A];全国炼钢连铸过程自动化技术交流会论文集[C];2006年
5 张德;董逸生;;基于XML的异构数据源集成系统[A];第十六届全国数据库学术会议论文集[C];1999年
6 王钦克;周立柱;;基于模式的半结构化数据重组[A];第十六届全国数据库学术会议论文集[C];1999年
7 王秋月;黄锦辉;于旭;郑进雄;;半结构数据的非精确结构提取[A];第十六届全国数据库学术会议论文集[C];1999年
8 王静;杜小勇;王珊;;Web站点查询系统的研究和设计[A];第十七届全国数据库学术会议论文集(研究报告篇)[C];2000年
9 杨良怀;唐世渭;王爱华;杨冬青;;XML代数及其查询优化方案[A];第十七届全国数据库学术会议论文集(技术报告篇)[C];2000年
10 王宇;黄炜;肖艳芹;任建立;李天柱;;ORBASE用于基于内容的Web查询[A];第十七届全国数据库学术会议论文集(技术报告篇)[C];2000年
中国博士学位论文全文数据库 前10条
1 蔺旭东;基于语义的XML查询及规范化研究[D];北京交通大学;2010年
2 汤华茂;基于语义的产业链网络化协同设计模式及关键技术研究[D];重庆大学;2010年
3 宁博;XML查询模式匹配及文档过滤技术研究[D];东北大学;2009年
4 高飞;关联规则挖掘算法研究[D];西安电子科技大学;2001年
5 简(王争)峰;基于XML的异构产品信息网上交换、检索技术研究与应用[D];浙江大学;2002年
6 娄渊胜;基于构件的分布式防汛信息系统框架研究[D];河海大学;2002年
7 者敬;开放式异构数据库复制框架的研究与实现[D];中国科学院研究生院(软件研究所);2002年
8 李效东;自治异构数据源的集成查询处理[D];中国科学院研究生院(软件研究所);2002年
9 叶志宝;支持企业业务过程持续改善的应用系统开发方法[D];中国科学院研究生院(软件研究所);2002年
10 郑淑丽;Web信息集成系统及查询优化方法研究[D];合肥工业大学;2003年
中国硕士学位论文全文数据库 前10条
1 夏光磊;关于XML的关系数据库存储查询技术研究[D];山东科技大学;2010年
2 刘丽苹;C-to-VHDL语言转换关键技术的研究与实现[D];哈尔滨工程大学;2010年
3 解荟霖;基于分布式数据集成技术的校园综合管理系统设计[D];中国海洋大学;2010年
4 杨芹;基于最大熵模型的中文网页分类器设计和实现[D];苏州大学;2010年
5 董爱平;信息隐藏技术在组态软件中的应用研究[D];苏州大学;2010年
6 张麟;XML数据查询优化技术的研究[D];哈尔滨理工大学;2010年
7 雷波;基于流程制造企业的ERP与CRM集成研究[D];昆明理工大学;2008年
8 付丽霞;钢铁企业质量管理与数据集成[D];昆明理工大学;2008年
9 劳阳辉;AOP代码中几种特定缺陷的软件测试方法[D];昆明理工大学;2010年
10 唐莉莉;基于XMPP的企业版IM系统及其在手机端实现的研究[D];电子科技大学;2010年
【同被引文献】
中国期刊全文数据库 前10条
1 李洁;搜索引擎中相关性测算发展研究[J];情报杂志;2003年12期
2 孙凤宏;;探索未来计算机技术发展与应用[J];青海统计;2007年11期
3 田莉;;计算机网络教学实践与心得[J];企业技术开发;2008年02期
4 鲍仕壮;徐超;谭守标;李正平;;Web页面表格内容的提取方法研究[J];软件导刊;2008年09期
5 黄豫清,戚广志,张福炎;从WEB文档中构造半结构化信息的抽取器[J];软件学报;2000年01期
6 王宁,王能斌;异构数据源集成系统查询分解和优化的实现[J];软件学报;2000年02期
7 王明文,孙永强;对象式Lam bda演算的自作用部分计值[J];软件学报;2001年08期
8 张世琨,张文娟,常欣,王立福,杨芙清;基于软件体系结构的可复用构件制作和组装[J];软件学报;2001年09期
9 梅宏,陈锋,冯耀东,杨杰;ABC:基于体系结构、面向构件的软件开发方法[J];软件学报;2003年04期
10 王庆,周俊梅,吴红伟,萧建昌,周傲英;XML文档及其函数依赖到关系的映射(英文)[J];软件学报;2003年07期
中国博士学位论文全文数据库 前9条
1 胥正川;基于关系数据库的XML数据存储、更新和检索[D];复旦大学;2003年
2 孙宏伟;XML与RDB的多层次双向数据集成技术研究[D];西北工业大学;2003年
3 崔巍;用本体实现地理信息系统语义集成和互操作[D];武汉大学;2004年
4 付相君;基于本体和Semantic Web技术的产品知识集成基础研究[D];浙江大学;2005年
5 徐志红;基于事件语义的时空数据模型的研究[D];武汉大学;2005年
6 黄茂军;地理本体的形式化表达机制及其在地图服务中的应用研究[D];武汉大学;2005年
7 杜文华;本体的构建及其在数字图书馆中的应用研究[D];武汉大学;2005年
8 鲁铭;基于本体的异构导航数据库集成与空间信息语义服务研究[D];华东师范大学;2006年
9 沈涌;数字信息资源整合策略与服务共享模式研究[D];吉林大学;2009年
中国硕士学位论文全文数据库 前10条
1 张瑞雪;基于DOM树的网页相似度研究与应用[D];大连理工大学;2011年
2 叶春晓;XML在数据集成中的应用研究[D];重庆大学;2002年
3 钱锐;基于XML的企业信息集成框架的研究[D];南京航空航天大学;2003年
4 张德海;NKI国家和地区地理知识的获取与分析[D];云南师范大学;2002年
5 李盛;面向真实文本的汉语词义排歧系统[D];山西大学;2003年
6 刘洋;基于Web的内容挖掘技术研究[D];哈尔滨工程大学;2003年
7 盛秋艳;基于Agent的个性化信息检索技术的研究[D];哈尔滨工程大学;2003年
8 朱韵篪;一种基于XML的分布式数据交换中间件(XDDX)研究[D];重庆大学;2003年
9 刘少雄;基于XML的空间元数据管理系统的研究与设计[D];中国地质大学;2003年
10 谭娜;基于XML的空间信息元数据管理系统[D];河南大学;2004年
【二级引证文献】
中国期刊全文数据库 前10条
1 朱建华;;一种基于Web的新闻抽取方法[J];情报杂志;2010年S2期
2 王云晓;曹宝香;张学诚;林晓鹏;;基于.NET的校园公共数据查询系统实现研究[J];信息技术与信息化;2008年03期
3 周永利;姜华;;基于物联网和GIS技术的“数字市政”在济南市政公用事业的应用[J];市政技术;2011年05期
4 黄淑芹;;基于XML的WEB数据抽取模型研究[J];通化师范学院学报;2012年02期
5 周永利;姜华;;济南数字市政体系框架研究与实践[J];微计算机应用;2011年10期
6 陈立娜;;面向制造业的主动搜索平台的研究与实现[J];现代计算机(专业版);2009年02期
7 黄序鑫;;基于XML和Web Service的数据集成研究与应用[J];现代计算机(专业版);2012年06期
8 王凯丽;;一种基于遗传算法的网页链接结构搜索算法[J];信息与电脑(理论版);2010年05期
9 李伟;刘瑞超;;基于学习曲线的油田数据服务分析[J];信息与电脑(理论版);2012年05期
10 芮文艳;;基于Lucene的web搜索引擎研究[J];信息与电脑(理论版);2012年10期
中国重要会议论文全文数据库 前1条
1 姚燕;李湘;郭萍;郑波;;基于中间件的异构数据检索服务[A];2011年中国气象学会气象通信与信息技术委员会暨国家气象信息中心科技年会论文摘要[C];2011年
中国博士学位论文全文数据库 前10条
1 杨晓蓉;分布式农业科技信息共享关键技术研究与应用[D];中国农业科学院;2011年
2 汪宙峰;地质灾害空间信息共享平台关键技术研究及应用[D];成都理工大学;2011年
3 周晶;面向产品全生命周期的网络化技术服务研究[D];东北大学;2009年
4 奚砚涛;基于开源技术的煤矿地测数据服务体系研究[D];中国矿业大学;2008年
5 周科松;全文检索与GIS一体化及在应急管理中的应用研究[D];华东师范大学;2009年
6 钟美;基于Web的空间本体构建方法研究[D];武汉大学;2010年
7 吴宗彦;基于网格的远程协同诊断系统的研究与实现[D];合肥工业大学;2009年
8 姜兴宇;网络化制造模式下产品全生命周期质量管理系统研究[D];东北大学;2008年
9 戴露;煤矿地测数据的地理本体与网络服务研究[D];中国矿业大学;2010年
10 张晶;我国高校仪器设备资源内部共享激励机制研究[D];西安建筑科技大学;2012年
中国硕士学位论文全文数据库 前10条
1 商翠珍;数据资源汇聚的可视化建模技术研究与应用[D];山东科技大学;2010年
2 朱静;数据资源汇聚中嵌套表格模型的研究与应用[D];山东科技大学;2010年
3 白冰;基于数据处理中心的企业竞争情报系统研究[D];山东科技大学;2010年
4 夏怀楠;支持跨域数据汇聚的关系数据访问服务研究[D];山东科技大学;2010年
5 孙明帅;面向NSSA的异构数据规范化处理与集成[D];哈尔滨工程大学;2010年
6 钱蕾;基于XML的异构数据库相互转换的研究与实现[D];沈阳理工大学;2010年
7 周月红;基于Lucene的站内搜索引擎的设计与开发[D];华东理工大学;2011年
8 黄根平;基于SDO的数据集成的研究与实现[D];解放军信息工程大学;2009年
9 文军舰;基于Nutch的Web结构挖掘算法研究[D];天津财经大学;2011年
10 任昌;基于多特征融合的网页对象自动定位技术研究[D];中北大学;2011年
【二级参考文献】
中国期刊全文数据库 前2条
1 杨树强,陈火旺,王峰;矢量和栅格一体化的数据模型[J];软件学报;1998年02期
2 王宁,陈滢,俞本权,徐宏炳,王能斌;一个基于CORBA的异构数据源集成系统的设计[J];软件学报;1998年05期
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026