收藏本站
《电子科技大学》 2006年
收藏 | 手机打开
二维码
手机客户端打开本文

基于ontology的Web表格内容抽取的研究与实现

林琳  
【摘要】: 如今,Web成为了网络信息的主要平台,是人们获取知识的主要来源。但是,由于Web页面的无结构性、超链接的自由无序、以及Web内容的海量性、多样性和动态变化,人们从Web上搜索真正想要的信息其实并不容易。Web信息抽取技术的发展,为现存的问题提供了很好的解决方案。它可以帮助人们更快更准确的获取知识。 作为一个表达关系信息的简洁而有效的途径,表格在Web文本中被经常使用,根据研究发现,在52%的HTML文档中,使用Table标签,虽然其中一些表格是用来使页面布局变得美观,但大部分表格是用来存放数据信息。正因为表格形式简洁并且含有丰富的信息,自动理解表格在知识管理、信息检索、Web挖掘、摘要提取以及对移动设备的内容传递等应用中有着非常广泛的用途。表格在网页中的普遍存在性以及它们能够简洁直观地描述关系信息的特性也使得他们成为Web信息抽取中吸引人的目标,研究Web表格信息抽取对Web信息抽取技术的研究有着重要的意义。 为了将目前无序的Web改造成有序的计算机可理解的知识宝库,Web创始人Tim Berners-Lee于1998年提出了Semantic Web(语义Web,或语义网)的构想,它是当前Web的扩展,其中的信息被赋予定义良好的含义,使计算机可以理解,从而和人更好的协作。语义Web采用多层次的表示框架,ontology位于从文档描述到知识推理转折的层次,因此ontology的构建是实现语义Web的关键环节。ontology就是用来描述某个领域(领域ontology)甚至更广范围(通用ontology)内的概念以及概念之间的联系,使得这些概念和联系在共享的范围内有着明确唯一的定义,达成一种共识,这样人和机器之间就可以进行交流。将ontology和Web信息抽取技术相结合,利用ontology来描述和表达信息抽取的知识库,增强抽取模板的语义表达能力,将信息抽取的重点放在特定的领域,可以大大提高信息抽取的准确率。基于ontology的抽取方法能将单词映射为概念实体,更加准确地体现文字的真实语义,同时通过ontology的类继承关系可以体现单词与单词之间天然的联系,使原来基于关键字的信息抽取的功能大大增强。 本研究小组经过深入研究,在BYU研究小组的Web表格信息抽取模型基础上,
【学位授予单位】:电子科技大学
【学位级别】:硕士
【学位授予年份】:2006
【分类号】:TP391.13

【相似文献】
中国期刊全文数据库 前10条
1 李景,钱平,苏晓鹭;构建基于Ontology的知识门户[J];现代图书情报技术;2004年02期
2 张蓉,申德荣,于戈;Ontology在异构数据库集成中的应用[J];计算机工程;2004年24期
3 潘宇斌,陈跃新;基于Ontology的自然语言理解[J];计算技术与自动化;2003年04期
4 廖乐健,曹元大,李新颖;基于Ontology的信息抽取[J];计算机工程与应用;2002年23期
5 孔怡青,孙玫;基于Ontology的Web语言OIL及其应用[J];计算机与现代化;2004年04期
6 常春;大型 Ontology构建工具 KAON的使用和评价[J];现代图书情报技术;2004年08期
7 谢枫平;Ontology与信息检索[J];龙岩师专学报;2004年06期
8 王文俊,刘昕鹏,罗英伟,汪小林,许卓群;应急事件Ontology语义模型及其应用[J];计算机工程;2005年10期
9 黄国景,崔志明;基于Ontology的个性化元搜索引擎研究[J];微电子学与计算机;2004年12期
10 蒋国瑞,赵书良;基于Multi-Agent和Ontology的技术性贸易壁垒预警预测系统设计[J];计算机工程与应用;2004年27期
中国重要会议论文全文数据库 前10条
1 王囡;王大玲;于戈;马婷;;Ontology-Scalability:一种基于本体实现社会网络可扩展性的算法[A];第二十四届中国数据库学术会议论文集(技术报告篇)[C];2007年
2 ;Web Information Extraction based on News Domain Ontology Theory[A];Proceedings 2010 IEEE 2nd Symposium on Web Society[C];2010年
3 刘金红;陆余良;;一种基于Ontology的网络信息过滤方法研究[A];2005年“数字安徽”博士科技论坛论文集[C];2005年
4 王敬贵;苏奋振;杨晓梅;杜云艳;仉天宇;;基于Ontology的空间知识查询方法研究[A];第十四届全国遥感技术学术交流会论文摘要集[C];2003年
5 ;A method for OWL Ontology Module Partition[A];Proceedings 2010 IEEE 2nd Symposium on Web Society[C];2010年
6 张亮;陈肇雄;黄河燕;张孝飞;;Ontology在智能信息检索中的应用[A];第二届全国学生计算语言学研讨会论文集[C];2004年
7 路涛;;Ontology的释译[A];第二届中国科技哲学及交叉学科研究生论坛论文集(硕士卷)[C];2008年
8 赵书城;高大庆;赵雅洁;;主题数字图书馆中基于Ontology的元数据建模研究[A];第二十届全国数据库学术会议论文集(研究报告篇)[C];2003年
9 周相兵;;基于Ontology的语义Web服务聚合自动机研究及应用[A];第二十七届中国控制会议论文集[C];2008年
10 姚文琳;王莉;王璀民;;基于Ontology的知识检索系统的设计与实现[A];2008'中国信息技术与应用学术论坛论文集(一)[C];2008年
中国重要报纸全文数据库 前10条
1 清华大学 陈丹 谢晓芹 蔡月茹;让知识可以共享和重用[N];计算机世界;2002年
2 何锡蓉;事关伦理[N];社会科学报;2002年
3 俞吾金(复旦大学) 杨学功(中国社会科学院) 张曙光(华中科技大学) 贺来(吉林大学) 高清海(吉林大学);超越本体论思维方式[N];社会科学报;2002年
4 杨宏声;“是论”之辨对于深化中西哲学比较的意义[N];社会科学报;2004年
5 陈赟;文明共存与哲学的发展[N];文汇报;2004年
6 亿维讯集团 宋保华 牛晓;可靠的创新[N];中国航空报;2005年
7 ;哲学轴心时代归来[N];社会科学报;2004年
8 方松华;反思20世纪中西哲学比较研究[N];社会科学报;2002年
9 中国科学技术大学知识管理研究所 周荣庭 陈果;基于知识管理架构电子政务平台[N];中国计算机报;2005年
10 清华大学计算机系 徐剑军 张钋 李涓子 王克宏;智能化应用的基石[N];计算机世界;2004年
中国博士学位论文全文数据库 前10条
1 王晓东;基于Ontology知识库系统建模与应用研究[D];华东师范大学;2003年
2 常春;Ontology在农业信息管理中的构建和转化[D];中国农业科学院;2004年
3 姚绍文;语义化Web的关键技术及其应用研究[D];电子科技大学;2002年
4 邱灿华;基于Ontology面向代理的供应链仿真建模方法研究[D];同济大学;2005年
5 梁晟;基于语义Web的服务自动组合技术的研究[D];中国科学院研究生院(软件研究所);2004年
6 Khalil Ahmed Saleh Al-mekhlafi;[D];大连理工大学;2011年
7 王靖;基于GO的基因功能及疾病相关通路分析[D];电子科技大学;2012年
8 马马杜 桑卡雷;基于多智能体的流体动力行业虚拟联盟信息检索的研究[D];浙江大学;2002年
9 陈钢;生物网络分析及其在复杂疾病研究中的应用[D];中南大学;2012年
10 徐飞;基于结构的对于水稻和稻瘟病菌相互作用所包含蛋白的计算研究[D];浙江大学;2009年
中国硕士学位论文全文数据库 前10条
1 林琳;基于ontology的Web表格内容抽取的研究与实现[D];电子科技大学;2006年
2 陈章;“Being”、“Ontology”、“Metaphysics”的内涵及关系[D];淮北师范大学;2010年
3 冯璐;网络环境下基于ontology的医学知识组织研究[D];黑龙江大学;2004年
4 朱增霞;基于Ontology的虚拟社群知识库构建与应用研究[D];山东理工大学;2012年
5 张琳;基于Ontology和XML的非结构化信息语义表示机制研究[D];武汉科技大学;2004年
6 陈兰;基于ontology的信息抽取系统的研究与实现[D];电子科技大学;2004年
7 孟令谦;基于ontology的中文信息抽取系统的研究与实现[D];电子科技大学;2004年
8 熊毅;基于ontology的内容安全技术研究与实现[D];电子科技大学;2004年
9 张在龙;基于Mobile Agent和ontology的协同工作引擎[D];电子科技大学;2003年
10 赵军;一个基于Ontology的数字权限表达语言的设计与实现[D];东南大学;2004年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026