收藏本站
《电子科技大学》 2005年
收藏 | 手机打开
二维码
手机客户端打开本文

面向信息抽取的ontology设计与实现

冯茜  
【摘要】:如今,Web 成为了网络信息的主要平台,是人们获取知识的主要来源。但是,由于Web 页面的无结构性、超链接的自由无序、以及Web 内容的海量性、多样性和动态变化,人们从Web 上搜索真正想要的信息其实并不容易。 从长远看,解决上述矛盾的根本方法就是变无序数据为有序知识,让计算机能够理解Web 信息,同时理解使用这些信息的人。Web 创始人Tim Berners-Lee于1998 年提出了Semantic Web(语义Web,或语义网)的构想,它是当前Web的扩展,其中的信息被赋予定义良好的含义,使计算机可以理解,从而和人更好的协作。 为了将目前无序的Web 改造成有序的计算机可理解的知识宝库,语义Web采用多层次的表示框架,ontology 位于从文档描述到知识推理转折的层次,因此ontology 的构建是实现语义Web 的关键环节。 ontology 就是用来描述某个领域(领域ontology)甚至更广范围(通用ontology)内的概念以及概念之间的联系,使得这些概念和联系在共享的范围内有着明确唯一的定义,达成一种共识,这样人和机器之间就可以进行交流。 将ontology 和信息抽取技术相结合,基于ontology 的信息抽取最大的优点是抽取对Web 页面的结构没有依赖性。利用ontology 来描述和表达信息抽取的知识库,增强抽取模板的语义表达能力,将信息抽取的重点放在特定的领域,可以大大提高信息抽取的准确率。基于ontology 的抽取方法能将单词映射为概念实体,更加准确地体现文字的真实语义,同时通过ontology 的类继承关系可以体现单词与单词之间天然的联系,使原来基于关键字的信息抽取的功能大大增强。 本文将基于ontology 的信息抽取技术应用于股票信息抽取。建立起股票ontology,利用领域ontology 中的概念、关系、关键字自动生成抽取规则,在对文章进行预处理后,利用生成的抽取规则对文章进行抽取,最后把结果存入数据库中,为用户提供查询和统计功能。 本文首先介绍了信息抽取技术及其产生背景和发展历史。接着对语义Web和ontology 理论进行了较为全面和完整的介绍。 在对从事研究所涉及的技术背景进行阐述后,第四章详细介绍了本项目基于ontology 的股票信息系统的框架结构和各部分的功能,并给出了一个实际抽取的例子。
【学位授予单位】:电子科技大学
【学位级别】:硕士
【学位授予年份】:2005
【分类号】:TP391.1

免费申请
【相似文献】
中国期刊全文数据库 前10条
1 王全剑;李芳;;基于Wikipedia的人名简历信息抽取[J];计算机应用与软件;2011年07期
2 魏晶晶;于然;廖祥文;;基于分隔符的中文论坛信息抽取[J];福建电脑;2011年06期
3 孙全红;张贞贞;;基于树结构的Web表格信息抽取方法[J];华北水利水电学院学报;2011年03期
4 钱程;阳小兰;;HTML到XML转换研究[J];计算机与现代化;2011年08期
5 范纯龙;夏佳;肖昕;吕红伟;徐蕾;;基于功能语义单元的博客评论抽取技术[J];计算机应用;2011年09期
6 王利鑫;耿焕同;孙凯;张茜;;基于自然语言处理的文本泄密自动检测技术[J];计算机工程与设计;2011年08期
7 梁吉光;田俊华;熊玲;;基于二阶HMM的信息抽取研究[J];情报杂志;2011年07期
8 张敏;;信息抽取技术在网页中的应用[J];中国城市经济;2011年20期
9 冯曦曦;朱学芳;;基于Spring框架的农业网站信息资源采集器设计与实现[J];信息化研究;2011年03期
10 孙中友;李培峰;朱巧明;;事件信息抽取中的数据预处理方法研究[J];计算机应用与软件;2011年08期
中国重要会议论文全文数据库 前10条
1 王囡;王大玲;于戈;马婷;;Ontology-Scalability:一种基于本体实现社会网络可扩展性的算法[A];第二十四届中国数据库学术会议论文集(技术报告篇)[C];2007年
2 ;Web Information Extraction based on News Domain Ontology Theory[A];Proceedings 2010 IEEE 2nd Symposium on Web Society[C];2010年
3 刘金红;陆余良;;一种基于Ontology的网络信息过滤方法研究[A];2005年“数字安徽”博士科技论坛论文集[C];2005年
4 崔欣辰;曲宁;陈青华;;隐马尔可夫模型在Web信息抽取中的几点改进[A];全国第4届信号和智能信息处理与应用学术会议论文集[C];2010年
5 王敬贵;苏奋振;杨晓梅;杜云艳;仉天宇;;基于Ontology的空间知识查询方法研究[A];第十四届全国遥感技术学术交流会论文摘要集[C];2003年
6 ;A method for OWL Ontology Module Partition[A];Proceedings 2010 IEEE 2nd Symposium on Web Society[C];2010年
7 张亮;陈肇雄;黄河燕;张孝飞;;Ontology在智能信息检索中的应用[A];第二届全国学生计算语言学研讨会论文集[C];2004年
8 陈康;武港山;;基于Ontology的信息检索技术研究[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
9 李纪华;夏薇;;基于XML的web信息提取方法研究[A];全国高校社科信息资料研究会第六次会员代表大会暨第13次学术研讨会论文集[C];2010年
10 路涛;;Ontology的释译[A];第二届中国科技哲学及交叉学科研究生论坛论文集(硕士卷)[C];2008年
中国重要报纸全文数据库 前10条
1 史小敏;前景广阔的信息抽取技术[N];解放军报;2004年
2 清华大学 陈丹 谢晓芹 蔡月茹;让知识可以共享和重用[N];计算机世界;2002年
3 彭芳;搜索也专业[N];中国计算机报;2004年
4 本报记者 王翌;8848:优化EC流程[N];计算机世界;2004年
5 俞吾金(复旦大学) 杨学功(中国社会科学院) 张曙光(华中科技大学) 贺来(吉林大学) 高清海(吉林大学);超越本体论思维方式[N];社会科学报;2002年
6 何锡蓉;事关伦理[N];社会科学报;2002年
7 上海交通大学APEX数据和知识管理实验室 王昊奋俞勇;语义Web推动下一代搜索[N];计算机世界;2007年
8 司静辉;直击数字环境下情报技术发展动向[N];科技日报;2007年
9 董振东;到用户中去[N];中国计算机报;2003年
10 杨宏声;“是论”之辨对于深化中西哲学比较的意义[N];社会科学报;2004年
中国博士学位论文全文数据库 前10条
1 刘亚清;开放式环境中的本体演化及其在信息抽取的应用研究[D];大连海事大学;2011年
2 刘娜;文本自动摘要和信息抽取方法及其应用研究[D];大连海事大学;2012年
3 王晓东;基于Ontology知识库系统建模与应用研究[D];华东师范大学;2003年
4 李传席;基于本体的自适应Web信息抽取方法研究[D];中国科学技术大学;2012年
5 常春;Ontology在农业信息管理中的构建和转化[D];中国农业科学院;2004年
6 张奇;信息抽取中实体关系识别研究[D];中国科学技术大学;2010年
7 姚绍文;语义化Web的关键技术及其应用研究[D];电子科技大学;2002年
8 胡国平;基于超大规模问答对库和语音界面的非受限领域自动问答系统研究[D];中国科学技术大学;2007年
9 余传明;基于本体的语义信息系统研究[D];武汉大学;2005年
10 邱灿华;基于Ontology面向代理的供应链仿真建模方法研究[D];同济大学;2005年
中国硕士学位论文全文数据库 前10条
1 陈兰;基于ontology的信息抽取系统的研究与实现[D];电子科技大学;2004年
2 孟令谦;基于ontology的中文信息抽取系统的研究与实现[D];电子科技大学;2004年
3 刘艺琴;基于本体的Web非规范知识处理中信息抽取技术研究[D];昆明理工大学;2005年
4 冯茜;面向信息抽取的ontology设计与实现[D];电子科技大学;2005年
5 刘建军;基于ontology的股票信息抽取系统的研究与实现[D];电子科技大学;2005年
6 周应强;基于本体的Web非规范知识处理中采集技术研究[D];昆明理工大学;2005年
7 马腾;基于ontology的信息抽取系统的研究与实现[D];电子科技大学;2006年
8 金璐钰;基于框架的事件抽取关键技术研究[D];苏州大学;2010年
9 杨柱;基于DIV标签树的网页主题信息抽取方法[D];湖南大学;2010年
10 田红;表格信息抽取引擎的设计与实现[D];西北师范大学;2004年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026