收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于ontology的中文信息抽取系统的研究与实现

孟令谦  
【摘要】:本文首先介绍了信息抽取技术及其产生背景和发展历史,分析了信息抽取系统体系结构、信息抽取的分类及信息抽取的关键技术和衡量指标。本文还介绍了ontology的基本知识。在此基础上,本文提出了一种基于ontology的信息抽取新方法。在本方法中,我们把信息抽取和ontology结合起来,先利用领域ontology里的概念、关系、关键字等自动生成抽取规则(Rule),然后对文章,句子进行语法分析预处理,再利用语法分析的结果和先前生成的抽取规则一起对文档进行信息抽取,最后把抽取的结果以记录的形式输出。 在本文中,我们根据上述方法并结合工程实际情况,设计了一个基于ontology的信息抽取系统并编写代码实现了这个系统。因此在本文中,我们详细介绍了系统的总体框架,系统的各主要模块的设计等。由于本系统是根据规则进行信息抽取的,所以本文还着重说明了一种基于Lex的信息抽取规则,介绍了它们的语法、抽取信息的方法以及自动产生抽取规则的算法等。 我们还详细介绍了本系统的实现方法,包括各个主要部分的数据结构,流程图等。最后利用此系统对一些样本进行抽取后的结果并对结果进行了分析。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 张涛;胡正华;夏明星;;远洋运输业业务邮件信息抽取系统的设计及实现[J];电脑知识与技术;2010年01期
2 柳佳刚;刘高嵩;贺令亚;陈山;;基于Web的信息抽取技术现状与发展[J];福建电脑;2007年07期
3 王建芳;;基于Ontology的科技动态信息获取机制[J];情报科学;2007年01期
4 陈兰,左志宏,熊毅,孟令谦;一种新的基于Ontology的信息抽取方法[J];计算机应用研究;2004年08期
5 陆科进,李新颖;基于Ontology的文本信息抽取[J];计算机应用研究;2003年07期
6 杜小勇,李曼,王大治;语义Web与本体研究综述[J];计算机应用;2004年10期
7 李景,钱平,苏晓鹭;构建基于Ontology的知识门户[J];现代图书情报技术;2004年02期
8 张蓉,申德荣,于戈;Ontology在异构数据库集成中的应用[J];计算机工程;2004年24期
9 潘宇斌,陈跃新;基于Ontology的自然语言理解[J];计算技术与自动化;2003年04期
10 孔怡青,孙玫;基于Ontology的Web语言OIL及其应用[J];计算机与现代化;2004年04期
11 常春;大型 Ontology构建工具 KAON的使用和评价[J];现代图书情报技术;2004年08期
12 冯艳;;基于语义标注和最小二乘神经网络的信息抽取[J];科技情报开发与经济;2008年20期
13 谢枫平;Ontology与信息检索[J];龙岩师专学报;2004年06期
14 王文俊,刘昕鹏,罗英伟,汪小林,许卓群;应急事件Ontology语义模型及其应用[J];计算机工程;2005年10期
15 张岩;;基于本体的信息抽取技术研究[J];科技信息(学术研究);2008年36期
16 牛之贤;白鹏洲;段富;;基于框架语义标注的自由文本信息抽取研究[J];计算机工程与应用;2008年25期
17 黄国景,崔志明;基于Ontology的个性化元搜索引擎研究[J];微电子学与计算机;2004年12期
18 蒋国瑞,赵书良;基于Multi-Agent和Ontology的技术性贸易壁垒预警预测系统设计[J];计算机工程与应用;2004年27期
19 王素芳;Ontology与叙词表的融合初探[J];大学图书馆学报;2005年01期
20 杨敏,陆朝俊;利用Prolog实现语义网中的知识推理[J];计算机应用与软件;2005年02期
中国重要会议论文全文数据库 前10条
1 王囡;王大玲;于戈;马婷;;Ontology-Scalability:一种基于本体实现社会网络可扩展性的算法[A];第二十四届中国数据库学术会议论文集(技术报告篇)[C];2007年
2 ;Web Information Extraction based on News Domain Ontology Theory[A];Proceedings 2010 IEEE 2nd Symposium on Web Society[C];2010年
3 刘金红;陆余良;;一种基于Ontology的网络信息过滤方法研究[A];2005年“数字安徽”博士科技论坛论文集[C];2005年
4 崔欣辰;曲宁;陈青华;;隐马尔可夫模型在Web信息抽取中的几点改进[A];全国第4届信号和智能信息处理与应用学术会议论文集[C];2010年
5 王敬贵;苏奋振;杨晓梅;杜云艳;仉天宇;;基于Ontology的空间知识查询方法研究[A];第十四届全国遥感技术学术交流会论文摘要集[C];2003年
6 ;A method for OWL Ontology Module Partition[A];Proceedings 2010 IEEE 2nd Symposium on Web Society[C];2010年
7 张亮;陈肇雄;黄河燕;张孝飞;;Ontology在智能信息检索中的应用[A];第二届全国学生计算语言学研讨会论文集[C];2004年
8 李纪华;夏薇;;基于XML的web信息提取方法研究[A];全国高校社科信息资料研究会第六次会员代表大会暨第13次学术研讨会论文集[C];2010年
9 吕国英;冯艳;李茹;;基于中文框架语义的信息抽取研究[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
10 陈康;武港山;;基于Ontology的信息检索技术研究[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
中国博士学位论文全文数据库 前10条
1 刘亚清;开放式环境中的本体演化及其在信息抽取的应用研究[D];大连海事大学;2011年
2 刘娜;文本自动摘要和信息抽取方法及其应用研究[D];大连海事大学;2012年
3 李传席;基于本体的自适应Web信息抽取方法研究[D];中国科学技术大学;2012年
4 王晓东;基于Ontology知识库系统建模与应用研究[D];华东师范大学;2003年
5 张奇;信息抽取中实体关系识别研究[D];中国科学技术大学;2010年
6 常春;Ontology在农业信息管理中的构建和转化[D];中国农业科学院;2004年
7 胡国平;基于超大规模问答对库和语音界面的非受限领域自动问答系统研究[D];中国科学技术大学;2007年
8 姚绍文;语义化Web的关键技术及其应用研究[D];电子科技大学;2002年
9 张乃洲;实体搜索爬虫和信息抽取研究[D];武汉大学;2011年
10 余传明;基于本体的语义信息系统研究[D];武汉大学;2005年
中国硕士学位论文全文数据库 前10条
1 陈兰;基于ontology的信息抽取系统的研究与实现[D];电子科技大学;2004年
2 孟令谦;基于ontology的中文信息抽取系统的研究与实现[D];电子科技大学;2004年
3 刘建军;基于ontology的股票信息抽取系统的研究与实现[D];电子科技大学;2005年
4 马腾;基于ontology的信息抽取系统的研究与实现[D];电子科技大学;2006年
5 刘艺琴;基于本体的Web非规范知识处理中信息抽取技术研究[D];昆明理工大学;2005年
6 金璐钰;基于框架的事件抽取关键技术研究[D];苏州大学;2010年
7 冯茜;面向信息抽取的ontology设计与实现[D];电子科技大学;2005年
8 杨柱;基于DIV标签树的网页主题信息抽取方法[D];湖南大学;2010年
9 田红;表格信息抽取引擎的设计与实现[D];西北师范大学;2004年
10 周应强;基于本体的Web非规范知识处理中采集技术研究[D];昆明理工大学;2005年
中国重要报纸全文数据库 前10条
1 史小敏;前景广阔的信息抽取技术[N];解放军报;2004年
2 清华大学 陈丹 谢晓芹 蔡月茹;让知识可以共享和重用[N];计算机世界;2002年
3 朱俊玄 商务印书馆;《语法分析讲稿》:方法与问题并重[N];中国社会科学报;2011年
4 彭芳;搜索也专业[N];中国计算机报;2004年
5 本报记者 王翌;8848:优化EC流程[N];计算机世界;2004年
6 刘慧英;口语语病的两个语法成因[N];语言文字周报;2011年
7 滕云;像男人一样去战斗?[N];中国妇女报;2006年
8 上海交通大学APEX数据和知识管理实验室 王昊奋俞勇;语义Web推动下一代搜索[N];计算机世界;2007年
9 俞吾金(复旦大学) 杨学功(中国社会科学院) 张曙光(华中科技大学) 贺来(吉林大学) 高清海(吉林大学);超越本体论思维方式[N];社会科学报;2002年
10 何锡蓉;事关伦理[N];社会科学报;2002年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978