收藏本站
《电子科技大学》 2004年
收藏 | 手机打开
二维码
手机客户端打开本文

基于ontology的中文信息抽取系统的研究与实现

孟令谦  
【摘要】:本文首先介绍了信息抽取技术及其产生背景和发展历史,分析了信息抽取系统体系结构、信息抽取的分类及信息抽取的关键技术和衡量指标。本文还介绍了ontology的基本知识。在此基础上,本文提出了一种基于ontology的信息抽取新方法。在本方法中,我们把信息抽取和ontology结合起来,先利用领域ontology里的概念、关系、关键字等自动生成抽取规则(Rule),然后对文章,句子进行语法分析预处理,再利用语法分析的结果和先前生成的抽取规则一起对文档进行信息抽取,最后把抽取的结果以记录的形式输出。 在本文中,我们根据上述方法并结合工程实际情况,设计了一个基于ontology的信息抽取系统并编写代码实现了这个系统。因此在本文中,我们详细介绍了系统的总体框架,系统的各主要模块的设计等。由于本系统是根据规则进行信息抽取的,所以本文还着重说明了一种基于Lex的信息抽取规则,介绍了它们的语法、抽取信息的方法以及自动产生抽取规则的算法等。 我们还详细介绍了本系统的实现方法,包括各个主要部分的数据结构,流程图等。最后利用此系统对一些样本进行抽取后的结果并对结果进行了分析。
【学位授予单位】:电子科技大学
【学位级别】:硕士
【学位授予年份】:2004
【分类号】:TP311.52

手机知网App
【引证文献】
中国期刊全文数据库 前2条
1 余承健;;基于表格语义的Web信息抽取方法的研究[J];电脑知识与技术;2008年12期
2 杜冬霞;谢红薇;刘畅;;基于关系数据库的应急预案领域本体构建研究[J];微计算机应用;2010年01期
中国硕士学位论文全文数据库 前8条
1 方少卿;Web就业信息抽取系统的实现研究[D];合肥工业大学;2010年
2 邱韬奋;基于聚类算法的Web信息抽取技术研究[D];暨南大学;2011年
3 朱媛媛;基于本体的电子商务信息抽取系统研究[D];河北大学;2011年
4 霍焰;基于非结构化文档数据的抽取与分析系统的信息抽取[D];天津大学;2012年
5 杨明莉;基于语义网的智能搜索模型的研究[D];东北师范大学;2007年
6 何璐;基于关系数据库的本体生成器的设计与实现[D];武汉科技大学;2008年
7 赵文;基于本体的Web信息抽取系统的研究与实现[D];沈阳工业大学;2007年
8 秦振海;基于Web的表格信息抽取研究[D];安徽大学;2010年
【参考文献】
中国期刊全文数据库 前10条
1 朱靖波,姚天顺;中文信息自动抽取[J];东北大学学报;1998年01期
2 徐林昊,杨文柱,张绍华,薛文玲,李天柱;Web信息查询研究进展[J];河北大学学报(自然科学版);2001年03期
3 陈少飞,郝亚南,李天柱,徐林昊,杨文柱;Web信息抽取技术研究进展[J];河北大学学报(自然科学版);2003年01期
4 武成岗,焦文品,田启家,史忠植;基于本体论和多主体的信息检索服务器[J];计算机研究与发展;2001年06期
5 许建潮,王颖楠,胥桂仙;Web文本信息抽取与挖掘方法[J];长春工业大学学报(自然科学版);2002年S1期
6 邓志鸿,唐世渭,杨冬青,张铭;基于XML的本体表示和检索技术的研究[J];计算机工程与应用;2002年03期
7 廖乐健,曹元大,李新颖;基于Ontology的信息抽取[J];计算机工程与应用;2002年23期
8 李保利,陈玉忠,俞士汶;信息抽取研究综述[J];计算机工程与应用;2003年10期
9 李晶;陈恩红;;Web信息抽取[J];计算机科学;2003年06期
10 廖明宏;本体论与信息检索[J];计算机工程;2000年02期
【共引文献】
中国期刊全文数据库 前10条
1 胡凌云;胡桂兰;徐勇;李龙澍;;基于Web的新闻文本分类技术的研究[J];安徽大学学报(自然科学版);2010年06期
2 王忠群,谢晓东;基于本体的异构软件集成技术的研究[J];安徽工程科技学院学报(自然科学版);2004年03期
3 胡思康;曹元大;;Web网页知识获取技术[J];北京理工大学学报;2006年12期
4 梁晔;周海燕;;本体论与语义Web[J];北京联合大学学报(自然科学版);2007年01期
5 刘鹏举;朱秀杰;周宇飞;李志清;唐小明;;基于OWL的森林资源数据智能化采集技术[J];北京林业大学学报;2008年01期
6 刘杰;束博;;一种高效的HTML/XHTML至WML的转换方法[J];北京工商大学学报(自然科学版);2006年06期
7 傅骞;温晓辉;;开放式Web信息抽取系统研究与实现[J];北京师范大学学报(自然科学版);2005年06期
8 仲兆满;刘宗田;;基于两级概念格的信息抽取的研究[J];江西师范大学学报(自然科学版);2008年02期
9 杨勇涛;;文本自动摘要提取算法[J];成都大学学报(自然科学版);2009年02期
10 陈挺;刘嘉勇;夏天;范刚;;基于平板型Web论坛的信息抽取研究[J];成都信息工程学院学报;2009年01期
中国重要会议论文全文数据库 前10条
1 曾青青;杨尔弘;;事件词驱动的文本事件信息结构初探[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
2 李伟刚;张克亮;王慧兰;;基于航空领域本体知识库的语义检索研究[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
3 李纪华;夏薇;;基于XML的web信息提取方法研究[A];全国高校社科信息资料研究会第六次会员代表大会暨第13次学术研讨会论文集[C];2010年
4 董俊林;聂伟;杨君英;张春炉;;命名实体识别与提取分析[A];逻辑学及其应用研究——第四届全国逻辑系统、智能科学与信息科学学术会议论文集[C];2008年
5 孙涌;韦小丽;;领域本体构建研究及在专利信息服务中的应用[A];江苏省系统工程学会第十一届学术年会论文集[C];2009年
6 曹晶;孙铁利;杨柳;;基于概念向量空间模型的信息检索方法[A];2006年全国理论计算机科学学术年会论文集[C];2006年
7 赵敬华;高慧颖;魏军;;基于本体的商品信息查询系统与算法研究[A];中国企业运筹学[C];2009年
8 曹怀虎;牛娃;张艳梅;;基于语义本体论的网格资源描述及匹配算法[A];第四届中国软件工程大会论文集[C];2007年
9 王松;杨沐昀;赵铁军;;基于统计的命名实体翻译[A];黑龙江省计算机学会2007年学术交流年会论文集[C];2007年
10 陈康;武港山;;基于Ontology的信息检索技术研究[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
中国博士学位论文全文数据库 前10条
1 宋岩;基于多Agent和本体的散杂货港口集团船舶调度系统研究[D];北京交通大学;2011年
2 杨抒;基于WEB的林产品信息资源整合方法研究[D];北京林业大学;2011年
3 杜萍;基于本体的中国行政区划地名识别与抽取研究[D];兰州大学;2011年
4 舒江波;面向中文信息处理的复句关系词自动标识研究[D];华中师范大学;2011年
5 仲兆满;事件本体及其在查询扩展中的应用[D];上海大学;2011年
6 吴承荣;骨干通道上的网络论坛通信信息监测和分析的关键技术研究[D];复旦大学;2011年
7 刘朝涛;中文问答系统中的句型理论及其应用研究[D];重庆大学;2010年
8 汤华茂;基于语义的产业链网络化协同设计模式及关键技术研究[D];重庆大学;2010年
9 黄九鸣;面向舆情分析和属性发现的网络文本挖掘技术研究[D];国防科学技术大学;2011年
10 马沁怡;基于KBE的快速有限元分析方法研究[D];大连理工大学;2011年
中国硕士学位论文全文数据库 前10条
1 孙岭;一种基于前缀表达式的Web信息抽取方法的关键问题的实现[D];山东科技大学;2010年
2 赵永华;多学科本体构建与集成技术研究[D];山东科技大学;2010年
3 唐微;网络信息提取系统关键技术研究[D];大连理工大学;2009年
4 红霞;基于层叠条件随机场的中文机构名识别的研究[D];大连理工大学;2010年
5 徐济成;面向农业领域的本体学习建模研究[D];安徽农业大学;2010年
6 朱利君;基于茶学领域本体的智能检索研究[D];安徽农业大学;2010年
7 王娜;基于Silverlight技术的本体编辑器的设计与实现[D];中国海洋大学;2010年
8 刘林;基于语义的元搜索引擎关键技术研究[D];河南工业大学;2010年
9 王娟;基于本体的课程资源管理系统研究[D];江西师范大学;2010年
10 李小红;基于自举的弱指导中文语义关系抽取研究[D];苏州大学;2010年
【同被引文献】
中国期刊全文数据库 前10条
1 邓志鸿,唐世渭,张铭,杨冬青,陈捷;Ontology研究综述[J];北京大学学报(自然科学版);2002年05期
2 郭玉滨;;Web文本挖掘技术及其应用的研究[J];电脑知识与技术;2006年08期
3 张成洪,肖军建,张诚;Web内容抽取及其数据管理方法[J];复旦学报(自然科学版);2001年02期
4 杨鹏,叶少珍;基于关键词和语义融合的WEB检索[J];福建电脑;2005年08期
5 郝丽,刘乐平,王星;数据挖掘(Data Mining)在体育统计中的应用[J];东华理工学院学报(社会科学版);2004年02期
6 陈少飞,郝亚南,李天柱,徐林昊,杨文柱;Web信息抽取技术研究进展[J];河北大学学报(自然科学版);2003年01期
7 杨敬伟;杨文柱;高悦;;基于DOM的Web信息抽取规则的构造与实现[J];河北大学学报(自然科学版);2007年02期
8 许卓明;王琦;;一种从关系数据库学习OWL本体的方法[J];河海大学学报(自然科学版);2006年02期
9 欧建雄,张礼平;HTML数据内容的抽取与集成[J];华东理工大学学报;2003年06期
10 荆涛,左万利;基于可视布局信息的网页噪音去除算法[J];华南理工大学学报(自然科学版);2004年S1期
中国博士学位论文全文数据库 前4条
1 聂培尧;基于XML的半结构数据管理及数据集成问题研究[D];西北工业大学;2002年
2 王晓东;基于Ontology知识库系统建模与应用研究[D];华东师范大学;2003年
3 杨志雄;面向大规模定制的Web零件库的若干关键技术和系统的研究[D];浙江大学;2004年
4 滕伟;面向Web信息集成的Web信息抽取中若干关键问题的研究[D];上海交通大学;2007年
中国硕士学位论文全文数据库 前10条
1 邓丽;面向主题的XML网页的模式和数据抽取[D];华侨大学;2004年
2 熊毅;基于ontology的内容安全技术研究与实现[D];电子科技大学;2004年
3 陈兰;基于ontology的信息抽取系统的研究与实现[D];电子科技大学;2004年
4 田红;表格信息抽取引擎的设计与实现[D];西北师范大学;2004年
5 薛惠忠;WEB信息的抽取与集成[D];东南大学;2004年
6 李毅;半结构化文档中语义信息抽取方法的研究[D];清华大学;2004年
7 李跃进;基于Internet的信息抽取技术研究[D];大连理工大学;2005年
8 方莹;基于句子聚类的信息抽取方法研究[D];山西大学;2005年
9 卢睿;基于XML的Web信息抽取研究[D];大连海事大学;2005年
10 吴爱珍;HTML表格数据抽取与集成[D];武汉大学;2004年
【二级引证文献】
中国期刊全文数据库 前3条
1 黄卫东;刘寅卯;盛昭瀚;;数字化预案中基于中介逻辑的不确定事件表示[J];数学的实践与认识;2011年23期
2 费勤龙;张克亮;朱沛胜;;基于WEB的机载雷达领域本体知识库的共建研究[J];微计算机应用;2010年09期
3 吴建安;吴雪莲;孙丙宇;;自然灾害应急预案形式化表示技术[J];计算机系统应用;2012年09期
中国博士学位论文全文数据库 前1条
1 杨志和;教育资源云服务本体与技术规范研究[D];华东师范大学;2012年
中国硕士学位论文全文数据库 前10条
1 韩晓光;基于语义网的智能信息检索[D];沈阳工业大学;2011年
2 杜振兴;面向爆破行业的领域本体自动提取技术研究[D];华南理工大学;2011年
3 朱媛媛;基于本体的电子商务信息抽取系统研究[D];河北大学;2011年
4 翟保荣;基于关系数据库的OWL本体的提取与存储研究[D];国防科学技术大学;2011年
5 汤炜;基于OWL的语义检索系统的研究与应用[D];武汉理工大学;2009年
6 李汝亮;基于Web的旅游突发事件信息搜索和获取技术研究[D];北京邮电大学;2009年
7 汪文颖;基于本体的知识检索框架的研究[D];南京航空航天大学;2009年
8 周书君;基于本体的无人机产品和技术信息搜索系统研究[D];南京航空航天大学;2009年
9 石静;基于本体的植物信息抽取与分析研究[D];西北农林科技大学;2010年
10 肖甜;本体构建及其在高速公路应急预案中的应用研究[D];河南科技大学;2012年
【二级参考文献】
中国期刊全文数据库 前10条
1 顾阳;论元结构理论介绍[J];国外语言学;1994年01期
2 林鸿飞,姚天顺;基于示例的中文文本过滤模型[J];大连理工大学学报;2000年03期
3 张绍华,徐林昊,杨文柱,薛文玲,李天柱;基于样本实例的Web信息抽取[J];河北大学学报(自然科学版);2001年04期
4 王继成,萧嵘,孙正兴,张福炎;Web信息检索研究进展[J];计算机研究与发展;2001年02期
5 武成岗,焦文品,田启家,史忠植;基于本体论和多主体的信息检索服务器[J];计算机研究与发展;2001年06期
6 王颖楠,滕飞,解莉,孙俏;Web挖掘技术[J];吉林工学院学报(自然科学版);2002年01期
7 胥桂仙,苏筱蔚,陈淑艳;中文文本挖掘中的无词典分词的算法及其应用[J];吉林工学院学报(自然科学版);2002年01期
8 谢丹夏;Web上的数据挖掘技术和工具设计[J];计算机工程与应用;2001年06期
9 阳小华;Web站点的超链结构挖掘[J];计算机工程与应用;2001年08期
10 王伟强;高文;段立娟;;Internet上的文本数据挖掘[J];计算机科学;2000年04期
中国重要会议论文全文数据库 前1条
1 黄萱菁;夏迎炬;吴立德;;基于向量空间模型的文本过滤系统[A];辉煌二十年——中国中文信息学会二十周年学术会议论文集[C];2001年
【相似文献】
中国期刊全文数据库 前10条
1 张涛;胡正华;夏明星;;远洋运输业业务邮件信息抽取系统的设计及实现[J];电脑知识与技术;2010年01期
2 柳佳刚;刘高嵩;贺令亚;陈山;;基于Web的信息抽取技术现状与发展[J];福建电脑;2007年07期
3 王建芳;;基于Ontology的科技动态信息获取机制[J];情报科学;2007年01期
4 陈兰,左志宏,熊毅,孟令谦;一种新的基于Ontology的信息抽取方法[J];计算机应用研究;2004年08期
5 陆科进,李新颖;基于Ontology的文本信息抽取[J];计算机应用研究;2003年07期
6 杜小勇,李曼,王大治;语义Web与本体研究综述[J];计算机应用;2004年10期
7 李景,钱平,苏晓鹭;构建基于Ontology的知识门户[J];现代图书情报技术;2004年02期
8 张蓉,申德荣,于戈;Ontology在异构数据库集成中的应用[J];计算机工程;2004年24期
9 潘宇斌,陈跃新;基于Ontology的自然语言理解[J];计算技术与自动化;2003年04期
10 孔怡青,孙玫;基于Ontology的Web语言OIL及其应用[J];计算机与现代化;2004年04期
中国重要会议论文全文数据库 前10条
1 王囡;王大玲;于戈;马婷;;Ontology-Scalability:一种基于本体实现社会网络可扩展性的算法[A];第二十四届中国数据库学术会议论文集(技术报告篇)[C];2007年
2 ;Web Information Extraction based on News Domain Ontology Theory[A];Proceedings 2010 IEEE 2nd Symposium on Web Society[C];2010年
3 刘金红;陆余良;;一种基于Ontology的网络信息过滤方法研究[A];2005年“数字安徽”博士科技论坛论文集[C];2005年
4 崔欣辰;曲宁;陈青华;;隐马尔可夫模型在Web信息抽取中的几点改进[A];全国第4届信号和智能信息处理与应用学术会议论文集[C];2010年
5 王敬贵;苏奋振;杨晓梅;杜云艳;仉天宇;;基于Ontology的空间知识查询方法研究[A];第十四届全国遥感技术学术交流会论文摘要集[C];2003年
6 ;A method for OWL Ontology Module Partition[A];Proceedings 2010 IEEE 2nd Symposium on Web Society[C];2010年
7 张亮;陈肇雄;黄河燕;张孝飞;;Ontology在智能信息检索中的应用[A];第二届全国学生计算语言学研讨会论文集[C];2004年
8 李纪华;夏薇;;基于XML的web信息提取方法研究[A];全国高校社科信息资料研究会第六次会员代表大会暨第13次学术研讨会论文集[C];2010年
9 吕国英;冯艳;李茹;;基于中文框架语义的信息抽取研究[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
10 陈康;武港山;;基于Ontology的信息检索技术研究[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
中国重要报纸全文数据库 前10条
1 史小敏;前景广阔的信息抽取技术[N];解放军报;2004年
2 清华大学 陈丹 谢晓芹 蔡月茹;让知识可以共享和重用[N];计算机世界;2002年
3 朱俊玄 商务印书馆;《语法分析讲稿》:方法与问题并重[N];中国社会科学报;2011年
4 彭芳;搜索也专业[N];中国计算机报;2004年
5 本报记者 王翌;8848:优化EC流程[N];计算机世界;2004年
6 刘慧英;口语语病的两个语法成因[N];语言文字周报;2011年
7 滕云;像男人一样去战斗?[N];中国妇女报;2006年
8 上海交通大学APEX数据和知识管理实验室 王昊奋俞勇;语义Web推动下一代搜索[N];计算机世界;2007年
9 俞吾金(复旦大学) 杨学功(中国社会科学院) 张曙光(华中科技大学) 贺来(吉林大学) 高清海(吉林大学);超越本体论思维方式[N];社会科学报;2002年
10 何锡蓉;事关伦理[N];社会科学报;2002年
中国博士学位论文全文数据库 前10条
1 刘亚清;开放式环境中的本体演化及其在信息抽取的应用研究[D];大连海事大学;2011年
2 刘娜;文本自动摘要和信息抽取方法及其应用研究[D];大连海事大学;2012年
3 李传席;基于本体的自适应Web信息抽取方法研究[D];中国科学技术大学;2012年
4 王晓东;基于Ontology知识库系统建模与应用研究[D];华东师范大学;2003年
5 张奇;信息抽取中实体关系识别研究[D];中国科学技术大学;2010年
6 常春;Ontology在农业信息管理中的构建和转化[D];中国农业科学院;2004年
7 胡国平;基于超大规模问答对库和语音界面的非受限领域自动问答系统研究[D];中国科学技术大学;2007年
8 姚绍文;语义化Web的关键技术及其应用研究[D];电子科技大学;2002年
9 张乃洲;实体搜索爬虫和信息抽取研究[D];武汉大学;2011年
10 余传明;基于本体的语义信息系统研究[D];武汉大学;2005年
中国硕士学位论文全文数据库 前10条
1 陈兰;基于ontology的信息抽取系统的研究与实现[D];电子科技大学;2004年
2 孟令谦;基于ontology的中文信息抽取系统的研究与实现[D];电子科技大学;2004年
3 刘建军;基于ontology的股票信息抽取系统的研究与实现[D];电子科技大学;2005年
4 马腾;基于ontology的信息抽取系统的研究与实现[D];电子科技大学;2006年
5 刘艺琴;基于本体的Web非规范知识处理中信息抽取技术研究[D];昆明理工大学;2005年
6 金璐钰;基于框架的事件抽取关键技术研究[D];苏州大学;2010年
7 冯茜;面向信息抽取的ontology设计与实现[D];电子科技大学;2005年
8 杨柱;基于DIV标签树的网页主题信息抽取方法[D];湖南大学;2010年
9 田红;表格信息抽取引擎的设计与实现[D];西北师范大学;2004年
10 周应强;基于本体的Web非规范知识处理中采集技术研究[D];昆明理工大学;2005年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026