收藏本站
《西北工业大学》 2001年
收藏 | 手机打开
二维码
手机客户端打开本文

Web信息提取技术研究

吕晓辉  
【摘要】: 信息提取就是从大量的数据中检索出有用的信息。但一般的Web信息提取 技术都是基于对Web上HTML文档的分析,本文提出了一种针对XML的信息 提取技术。XML(eXtensible Markup Language)是用于描述在Internet网上用于数 据交换的数据文档的格式的一种语言标准。它将结构、内容和表现分离。数据可 被XML唯一标识,从而有利于用户对数据的组织和检索。 组件对象模型COM,是一种以组件为发布单位的对象模型,这种模型使各 软件组件可以用一种统一的方式进行交互。COM除了具有面向对象的特性和客 户/服务器特性这两个基本特性外,还有语言无关性、进程透明性和可重用性。 COM作为一种软件模型,不仅提供了程序与程序之间通信的标准,而且可以改 变传统的程序设计方法。 本文首先对XML技术的发展和特点做了论述,将它与HTML做了比较。接 着阐述了COM的基本原理和COM的客户/服务模型,介绍了基于COM的组件 化程序设计方法,将其与面向对象的程序设计方法进行了比较,并对COM技术 的未来进行了展望。在以上理论的基础上,再加上ASP(Active Server Pages)技术, 设计和实现了一个基于“ XML+COM+ASP”技术的一个应用系统。该系统可对 XML数据文档进行分析和查询。本文描述了分析和查询XML数据文档的方式 和算法,以及定制COM的结构,并在Windows NT Workstation上用Microsoft 的IIS作为Web服务器,使用定制的COM,实现了一个XML文档分析查询器。 最后,本文对所定制的COM进行了分析,对所实现的系统的特点进行了阐 述,指出了存在的问题,并提出了有待进一步探讨的问题。
【学位授予单位】:西北工业大学
【学位级别】:硕士
【学位授予年份】:2001
【分类号】:TP393.03

手机知网App
【相似文献】
中国硕士学位论文全文数据库 前10条
1 吕晓辉;Web信息提取技术研究[D];西北工业大学;2001年
2 楚王辉;基于组件技术的地质图形系统[D];成都理工大学;2002年
3 方强;基于工作流的分布式办公系统的研究与实现[D];华中科技大学;2004年
4 李冰山;COM组件技术及其应用[D];大连理工大学;2000年
5 周杲;地质科学计算可视化软件系统研究[D];成都理工大学;2002年
6 朱强;COM组件技术探究及基于COM的即时通讯软件设计[D];郑州大学;2003年
7 杨祖龙;基于组件技术的微软Excel内部结构分析及其在企业表格处理软件中的开发[D];中国地质大学;2003年
8 蒋岳志;组件化海图显控系统的研究与实现[D];哈尔滨工程大学;2004年
9 张磊;基于消息队列的自治异构信息查询系统的研究与实现[D];国防科学技术大学;2003年
10 石争浩;《计算机组成原理》CAI及其多媒体课件实现技术研究[D];西安理工大学;2000年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026