收藏本站
《电子科技大学》 2006年
收藏 | 手机打开
二维码
手机客户端打开本文

基于ontology的信息抽取系统的研究与实现

马腾  
【摘要】: 随着Intenet的快速发展,web已经成为跨全球的信息源。使用传统的搜索引擎,用户要精确地找到所需信息往往十分困难。提高搜索引擎准确性的一个主要途径是使其在某种程度上理解信息源的内容。基于此,本文提出一种基于ontology信息抽取技术,它把ontology和信息处理技术结合起来,是现在信息抽取研究的一个热点,其最大的优点是对网页结构的依赖很少,只要事先创建的应用领域ontology足够强大,系统可以对该应用领域中各种文本实现信息抽取。这项技术对网络资源的分类、登记建档及进一步的监管和过滤具有重要意义。 本文首先介绍了信息抽取技术及其产生背景和发展历史,分析了信息抽取系统体系结构、信息抽取的分类及信息抽取的关键技术和衡量指标,然后介绍了ontology的基本知识。在此基础上,本文提出了一种基于ontology的信息抽取新方法。在本方法中,把信息抽取和ontology结合起来,先利用领域ontology里的概念、关系、关键字等自动生成抽取规则(Rule),然后对文章、句子进行语法分析预处理,再利用语法分析的结果和先前生成的抽取规则一起对文档进行信息抽取,最后把抽取的结果以记录的形式输出。根据上述方法并结合工程实际情况,设计并实现了一个基于ontology的信息抽取系统。 在本文中,对系统的总体框架、系统的各主要模块功能、基于Lex的信息抽取规则及自动产生抽取规则的算法进行了逐一阐述。在系统的实现中详细介绍了本系统的实现方法,包括各个主要部分的数据结构,流程图等。最后利用此系统对一些样本进行抽取后的结果并对结果进行了分析。
【学位授予单位】:电子科技大学
【学位级别】:硕士
【学位授予年份】:2006
【分类号】:TP311.52

【引证文献】
中国期刊全文数据库 前2条
1 陈立娜;张红;马莉;蒋运承;;基于本体的旅游信息抽取[J];计算机应用与软件;2010年04期
2 姜鹏;许峰;戚荣志;;一种基于云平台的防汛文档智能生成模型构建[J];水利信息化;2013年03期
中国硕士学位论文全文数据库 前10条
1 孙文婷;基于语义的网上股评信息的提取研究[D];武汉理工大学;2011年
2 易利涛;基于领域本体的Web信息抽取研究[D];中南大学;2011年
3 白鹏洲;基于框架语义标注的Web信息抽取技术研究[D];太原理工大学;2008年
4 陈金鑫;基于WEB的书目信息自动搜集与服务[D];南京师范大学;2008年
5 杨建锋;虚拟学习社区中学习资源自动生成系统的设计与实现[D];西北大学;2009年
6 陈立娜;基于本体的旅游领域Web信息抽取[D];广西师范大学;2009年
7 张红;基于本体的旅游领域Deep Web查询接口集成[D];广西师范大学;2009年
8 石静;基于本体的植物信息抽取与分析研究[D];西北农林科技大学;2010年
9 胡常军;基于知识的医学图像检索[D];电子科技大学;2010年
10 康琪;基于Bootstrapping的领域知识自动抽取技术的研究[D];山东大学;2012年
【参考文献】
中国期刊全文数据库 前10条
1 邓志鸿,唐世渭,张铭,杨冬青,陈捷;Ontology研究综述[J];北京大学学报(自然科学版);2002年05期
2 李保利,陈玉忠,俞士汶;信息抽取研究综述[J];计算机工程与应用;2003年10期
3 李晶;陈恩红;;Web信息抽取[J];计算机科学;2003年06期
4 廖明宏;本体论与信息检索[J];计算机工程;2000年02期
5 徐振宁,宋阔益,张维明,李勇,李由;基于本体的语义信息查询系统的研究与实现[J];计算机工程;2002年12期
6 万捷,滕至阳;本体论在基于内容信息检索中的应用[J];计算机工程;2003年04期
7 李芳,盛焕烨,姚天昉;信息检索与信息抽取技术的研究[J];计算机应用研究;2002年01期
8 王庆一,王继成,周源远,袁春风;多信息块Web页面的信息抽取[J];计算机应用研究;2002年10期
9 陆科进,李新颖;基于Ontology的文本信息抽取[J];计算机应用研究;2003年07期
10 周武,金远平;构建XML本体信息研究[J];微机发展;2003年10期
【共引文献】
中国期刊全文数据库 前10条
1 梁峰;金莹;;基于Agent技术的语义网服务模型[J];安徽广播电视大学学报;2008年01期
2 陶皖,李平,廖述梅;当前基于本体的语义标注工具的分析[J];安徽工程科技学院学报(自然科学版);2005年02期
3 赵秀芳;;基于本体的农业信息检索[J];安徽农业科学;2006年10期
4 蔡曈;徐惠;吴群;;土壤质量聚类分析——以封丘县为例[J];安徽农业科学;2008年25期
5 薛荟;谭三清;;林业应用系统本体知识模型的构建方法研究[J];现代农业科技;2011年07期
6 李善飞;鲁延京;杨克巍;谭跃进;;武器装备体系能力形式化描述研究[J];兵工自动化;2010年02期
7 黄洪;刘增良;余达太;周绍华;;一种具有免疫特征的智能数据分类分级模型[J];兵工学报;2010年12期
8 黄洪;刘增良;余达太;;一种智能化的数据分类、分级及保护模型[J];北京工业大学学报;2011年06期
9 胡思康;曹元大;;Web网页知识获取技术[J];北京理工大学学报;2006年12期
10 梁晔;周海燕;;本体论与语义Web[J];北京联合大学学报(自然科学版);2007年01期
中国重要会议论文全文数据库 前10条
1 李贵;张兆鑫;李征宇;韩子洋;;WEB环境下基于领域本体的语义匹配技术研究[A];科学发展与社会责任(A卷)——第五届沈阳科学学术年会文集[C];2008年
2 李伟刚;张克亮;王慧兰;;基于航空领域本体知识库的语义检索研究[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
3 王建州;李廉;汪映海;;面向Ontology的电力信息系统的研究[A];2005年信息与通信领域博士后学术会议论文集[C];2005年
4 郑笈;李思昆;陆筱霞;;大规模场景绘制的存储数据调度组织研究[A];节能环保 和谐发展——2007中国科协年会论文集(一)[C];2007年
5 杨昆;王军;彭双云;;基于Ontology的空间信息互操作初步研究[A];中国地理信息系统协会第八届年会论文集[C];2004年
6 范志煜;肖兵;沈薇薇;;基于概率本体的态势估计应用研究[A];中国自动化学会中南六省(区)2010年第28届年会·论文集[C];2010年
7 贾凌燕;陆一平;;浅谈ontology方法及其发展[A];全国先进制造技术高层论坛暨制造业自动化、信息化技术研讨会论文集[C];2005年
8 董俊林;聂伟;杨君英;张春炉;;命名实体识别与提取分析[A];逻辑学及其应用研究——第四届全国逻辑系统、智能科学与信息科学学术会议论文集[C];2008年
9 王晓东;孙滨;李学威;;商空间模型下不确定本体知识推理研究[A];计算机研究新进展(2010)——河南省计算机学会2010年学术年会论文集[C];2010年
10 陈立;宋自林;郑世明;张英;;基于本体的概念相似度计算研究[A];江苏省系统工程学会第十一届学术年会论文集[C];2009年
中国博士学位论文全文数据库 前10条
1 卜志国;海洋生态环境监测系统数据集成与应用研究[D];中国海洋大学;2010年
2 熊晶;海洋生态本体的建模方法研究及应用[D];中国海洋大学;2010年
3 张俐;面向概念设计方案选择的协同决策方法研究[D];华中科技大学;2010年
4 韩赟;高技术虚拟企业(HTVE)知识管理模式研究[D];哈尔滨理工大学;2009年
5 王亚萍;需求驱动的个性化产品配置设计方法研究[D];哈尔滨理工大学;2010年
6 游颖;客车信息集成控制系统配置设计中的分解技术研究[D];武汉理工大学;2010年
7 连莉;本体中非分类关系的理论体系研究[D];山东大学;2010年
8 魏巍;定制产品智能重组设计关键技术与方法研究及其应用[D];浙江大学;2010年
9 王德鑫;四路摄像头协同多重触控技术研究与实现[D];国防科学技术大学;2010年
10 张巍;融合FAQ、本体和推理技术的问答系统研究[D];太原理工大学;2011年
中国硕士学位论文全文数据库 前10条
1 厉颖;基于本体的服装领域知识表示的建模研究[D];山东科技大学;2010年
2 孙岭;一种基于前缀表达式的Web信息抽取方法的关键问题的实现[D];山东科技大学;2010年
3 吕媛媛;基于本体的物流信息集成系统的研究[D];山东科技大学;2010年
4 许坤;基于本体的应急信息管理系统的研究与设计[D];郑州大学;2010年
5 王洋;基于潜在语义分析的智能搜索技术研究[D];哈尔滨工程大学;2010年
6 刘洋;基于本体的医保审计知识库构建研究[D];哈尔滨工程大学;2010年
7 刘海娇;基于魔力平台的需求分析系统的研究与实现[D];哈尔滨工程大学;2010年
8 杜娟;基于语义网格的知识地图资源组织研究与应用[D];哈尔滨工程大学;2010年
9 唐微;网络信息提取系统关键技术研究[D];大连理工大学;2009年
10 卫剑平;基于本体的可定制用户界面研究与实现[D];大连理工大学;2010年
【同被引文献】
中国期刊全文数据库 前10条
1 郑怀国;谭翠萍;李光达;常春;;植物病虫害防治本体模型构建研究[J];安徽农业科学;2009年02期
2 邓志鸿,唐世渭,张铭,杨冬青,陈捷;Ontology研究综述[J];北京大学学报(自然科学版);2002年05期
3 单安山,石宝明,贾树英,朱正鹏;HACCP与绿色畜产品生产[J];东北农业大学学报;2004年01期
4 李红美;认知灵活性理论与基于网络的研究性学习[J];中国远程教育;2003年01期
5 王丽珍;信息技术与研究性学习整合于专题学习网站的思考[J];中国远程教育;2004年09期
6 吴云芳;;词义消歧研究:资源、方法与评测[J];当代语言学;2009年02期
7 王超杰;认知弹性理论与网络课程设计[J];电化教育研究;2001年04期
8 顾力雄;用学习理论指导基于WWW的网络教学[J];电化教育研究;1998年02期
9 李向阳;张亚非;;一种基于遗传算法的语义标注[J];电子科技大学学报;2007年01期
10 葛芬;吴宁;;基于多种技术的Word设计文档自动生成平台[J];电子科技大学学报;2007年02期
中国博士学位论文全文数据库 前6条
1 由丽萍;构建现代汉语框架语义知识库技术研究[D];上海师范大学;2006年
2 姜吉发;自由文本的信息抽取模式获取的研究[D];中国科学院研究生院(计算技术研究所);2004年
3 陈海霞;面向数据挖掘的分类器集成研究[D];吉林大学;2006年
4 周顺先;文本信息抽取模型及算法研究[D];湖南大学;2007年
5 史树敏;基于领域本体的汉语共指消解及相关技术研究[D];南京理工大学;2008年
6 车万翔;基于核方法的语义角色标注研究[D];哈尔滨工业大学;2008年
中国硕士学位论文全文数据库 前10条
1 谷文;基于概念树的Web信息抽取技术研究[D];长春工业大学;2010年
2 梁越岭;互联网舆情信息挖掘与群体行为分析[D];武汉理工大学;2010年
3 陈晶;基于网页的信息抽取的研究[D];西安工业大学;2011年
4 田鹤楠;质检总局舆情监控系统中信息抽取的研究[D];北京邮电大学;2011年
5 徐荣华;基于功能本体的产品结构功能映射分析与再创新设计研究[D];南京航空航天大学;2010年
6 杨浩博;基于功能本体的创新知识表达及检索方法研究与实现[D];河北工业大学;2011年
7 李业成;网络论坛舆情监控系统的研究及设计[D];华南理工大学;2011年
8 狄慧;基于Agent的Web信息抽取研究[D];大连理工大学;2004年
9 孟令谦;基于ontology的中文信息抽取系统的研究与实现[D];电子科技大学;2004年
10 陈兰;基于ontology的信息抽取系统的研究与实现[D];电子科技大学;2004年
【二级引证文献】
中国期刊全文数据库 前8条
1 刘文静;许志伟;何聪慧;;WEB到WAP的转换过程中页面去噪问题的研究[J];计算机应用与软件;2012年04期
2 李君轶;张柳;孙九林;杨敏;;旅游信息科学:一个研究框架[J];旅游学刊;2011年06期
3 段宇锋;黑珍珍;鞠菲;;中文植物描述数据的一致性研究[J];情报科学;2012年05期
4 王志华;魏斌;李占波;赵伟;;基于本体的Web信息抽取系统[J];计算机工程与设计;2012年07期
5 张莉萍;;基于领域本体构建的Web信息抽取[J];图书情报工作网刊;2011年05期
6 金燕;;基于本体的Web信息抽取研究综述[J];图书馆学研究;2012年16期
7 张莉萍;;基于领域本体构建的Web信息抽取[J];嘉兴学院学报;2010年06期
8 段宇锋;黑珍珍;鞠菲;崔红;;基于自主学习规则的中文物种描述文本的语义标注研究[J];现代图书情报技术;2012年05期
中国博士学位论文全文数据库 前1条
1 杨志和;教育资源云服务本体与技术规范研究[D];华东师范大学;2012年
中国硕士学位论文全文数据库 前10条
1 兰凯梅;BBS热点话题发现与监控系统[D];北京交通大学;2011年
2 孙文婷;基于语义的网上股评信息的提取研究[D];武汉理工大学;2011年
3 石京;基于语义本体的垂直搜索引擎模型研究[D];大连海事大学;2011年
4 李大伟;构建基于BlackBoard的虚拟学习社区[D];河北师范大学;2011年
5 易利涛;基于领域本体的Web信息抽取研究[D];中南大学;2011年
6 何军;兰州大学网络教育学院远程学习平台虚拟学习社区构建策略研究[D];西北师范大学;2011年
7 徐卫;Web新闻热点发现系统的设计与实现[D];华中科技大学;2011年
8 于鹏;基于自然语言打印机人机交互方法研究与实现[D];大连理工大学;2011年
9 康旭珍;框架元素语义核心词自动识别研究[D];山西大学;2011年
10 赵文娟;基于汉语框架本体的网络资源标注[D];山西大学;2010年
【二级参考文献】
中国期刊全文数据库 前4条
1 廖明宏;本体论与信息检索[J];计算机工程;2000年02期
2 王海波,姜吉发,耿晖,白硕,祝明发;XML搜索引擎研究[J];计算机应用研究;2001年04期
3 刘秉伟,黄萱菁,郭以昆,吴立德;基于统计方法的中文姓名识别[J];中文信息学报;2000年03期
4 杨文清,黄宜华,张福炎;中文Web文档库全文检索技术研究与实现[J];中文信息学报;1999年04期
【相似文献】
中国期刊全文数据库 前10条
1 李景,钱平,苏晓鹭;构建基于Ontology的知识门户[J];现代图书情报技术;2004年02期
2 张蓉,申德荣,于戈;Ontology在异构数据库集成中的应用[J];计算机工程;2004年24期
3 潘宇斌,陈跃新;基于Ontology的自然语言理解[J];计算技术与自动化;2003年04期
4 廖乐健,曹元大,李新颖;基于Ontology的信息抽取[J];计算机工程与应用;2002年23期
5 孔怡青,孙玫;基于Ontology的Web语言OIL及其应用[J];计算机与现代化;2004年04期
6 常春;大型 Ontology构建工具 KAON的使用和评价[J];现代图书情报技术;2004年08期
7 谢枫平;Ontology与信息检索[J];龙岩师专学报;2004年06期
8 王文俊,刘昕鹏,罗英伟,汪小林,许卓群;应急事件Ontology语义模型及其应用[J];计算机工程;2005年10期
9 黄国景,崔志明;基于Ontology的个性化元搜索引擎研究[J];微电子学与计算机;2004年12期
10 蒋国瑞,赵书良;基于Multi-Agent和Ontology的技术性贸易壁垒预警预测系统设计[J];计算机工程与应用;2004年27期
中国重要会议论文全文数据库 前10条
1 ;Web Information Extraction based on News Domain Ontology Theory[A];Proceedings 2010 IEEE 2nd Symposium on Web Society[C];2010年
2 王囡;王大玲;于戈;马婷;;Ontology-Scalability:一种基于本体实现社会网络可扩展性的算法[A];第二十四届中国数据库学术会议论文集(技术报告篇)[C];2007年
3 刘金红;陆余良;;一种基于Ontology的网络信息过滤方法研究[A];2005年“数字安徽”博士科技论坛论文集[C];2005年
4 王敬贵;苏奋振;杨晓梅;杜云艳;仉天宇;;基于Ontology的空间知识查询方法研究[A];第十四届全国遥感技术学术交流会论文摘要集[C];2003年
5 ;A method for OWL Ontology Module Partition[A];Proceedings 2010 IEEE 2nd Symposium on Web Society[C];2010年
6 张亮;陈肇雄;黄河燕;张孝飞;;Ontology在智能信息检索中的应用[A];第二届全国学生计算语言学研讨会论文集[C];2004年
7 路涛;;Ontology的释译[A];第二届中国科技哲学及交叉学科研究生论坛论文集(硕士卷)[C];2008年
8 赵书城;高大庆;赵雅洁;;主题数字图书馆中基于Ontology的元数据建模研究[A];第二十届全国数据库学术会议论文集(研究报告篇)[C];2003年
9 周相兵;;基于Ontology的语义Web服务聚合自动机研究及应用[A];第二十七届中国控制会议论文集[C];2008年
10 姚文琳;王莉;王璀民;;基于Ontology的知识检索系统的设计与实现[A];2008'中国信息技术与应用学术论坛论文集(一)[C];2008年
中国重要报纸全文数据库 前10条
1 清华大学 陈丹 谢晓芹 蔡月茹;让知识可以共享和重用[N];计算机世界;2002年
2 俞吾金(复旦大学) 杨学功(中国社会科学院) 张曙光(华中科技大学) 贺来(吉林大学) 高清海(吉林大学);超越本体论思维方式[N];社会科学报;2002年
3 何锡蓉;事关伦理[N];社会科学报;2002年
4 杨宏声;“是论”之辨对于深化中西哲学比较的意义[N];社会科学报;2004年
5 陈赟;文明共存与哲学的发展[N];文汇报;2004年
6 亿维讯集团 宋保华 牛晓;可靠的创新[N];中国航空报;2005年
7 ;哲学轴心时代归来[N];社会科学报;2004年
8 方松华;反思20世纪中西哲学比较研究[N];社会科学报;2002年
9 中国科学技术大学知识管理研究所 周荣庭 陈果;基于知识管理架构电子政务平台[N];中国计算机报;2005年
10 清华大学计算机系 徐剑军 张钋 李涓子 王克宏;智能化应用的基石[N];计算机世界;2004年
中国博士学位论文全文数据库 前10条
1 王晓东;基于Ontology知识库系统建模与应用研究[D];华东师范大学;2003年
2 常春;Ontology在农业信息管理中的构建和转化[D];中国农业科学院;2004年
3 姚绍文;语义化Web的关键技术及其应用研究[D];电子科技大学;2002年
4 邱灿华;基于Ontology面向代理的供应链仿真建模方法研究[D];同济大学;2005年
5 梁晟;基于语义Web的服务自动组合技术的研究[D];中国科学院研究生院(软件研究所);2004年
6 Khalil Ahmed Saleh Al-mekhlafi;[D];大连理工大学;2011年
7 王靖;基于GO的基因功能及疾病相关通路分析[D];电子科技大学;2012年
8 马马杜 桑卡雷;基于多智能体的流体动力行业虚拟联盟信息检索的研究[D];浙江大学;2002年
9 陈钢;生物网络分析及其在复杂疾病研究中的应用[D];中南大学;2012年
10 徐飞;基于结构的对于水稻和稻瘟病菌相互作用所包含蛋白的计算研究[D];浙江大学;2009年
中国硕士学位论文全文数据库 前10条
1 陈章;“Being”、“Ontology”、“Metaphysics”的内涵及关系[D];淮北师范大学;2010年
2 冯璐;网络环境下基于ontology的医学知识组织研究[D];黑龙江大学;2004年
3 朱增霞;基于Ontology的虚拟社群知识库构建与应用研究[D];山东理工大学;2012年
4 张琳;基于Ontology和XML的非结构化信息语义表示机制研究[D];武汉科技大学;2004年
5 陈兰;基于ontology的信息抽取系统的研究与实现[D];电子科技大学;2004年
6 孟令谦;基于ontology的中文信息抽取系统的研究与实现[D];电子科技大学;2004年
7 董伟;基于Ontology的水稻栽培知识管理系统研究[D];安徽农业大学;2011年
8 张猛;基于Ontology的旅游黄页语义检索研究与应用[D];北京工业大学;2013年
9 熊毅;基于ontology的内容安全技术研究与实现[D];电子科技大学;2004年
10 赵军;一个基于Ontology的数字权限表达语言的设计与实现[D];东南大学;2004年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026