收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

面向半结构化文本的领域本体自动构建研究

程晓  
【摘要】: 对于一个领域的特殊应用来说,本体是一个非常有价值的资源,尤其在需要领域知识的情况下。随着科技的快速发展,互联网的广泛普及,信息量极大丰富,知识的增长与更新速度日益加快,快速构建和更新领域知识库的需求更加迫切。本体作为清晰和规范描述领域概念和实例及其之间相互关系的知识库得到越来越广泛的重视和应用。本文主要针对本体自动构建中的一些关键技术进行了研究,具体研究内容主要包括以下几个方面: (1)设计了一种两个层级的领域本体组成结构。该结构将本体中的节点分为概念层级和实例层级,不同的层级具有不同的本体组成结构。提出了基于核心本体的本体构建方法,利用种子实例来构建核心本体,然后利用从文本中获取知识的方法来扩展本体,最终生成一个完整的领域本体。 (2)利用网页布局特征,提出半结构化文本的领域本体结构及实例的抽取方法。领域本体结构抽取,包括利用模板的方法抽取领域本体概念的候选属性,以及利用统计学方法对候选属性进行过滤。领域本体实例的抽取,将领域本体的结构信息作为线索自动生成实例的抽取模板,进而利用Web网页特有的结构特征获得实例的结构信息。在针对电影,音乐和图书三个领域进行的实验中,本体结构抽取的准确率和召回率最高为86.7%,100%,实例抽取的准确率和召回率最高可达83.9%,87.4%。 (3)通过模式匹配的方法进行关系抽取和领域本体的更新。在关系抽取中,利用实体间的共现抽取关系模式,经聚类以及合并之后获得若干个类别的关系模式。在领域本体更新中,使用各类关系模式获得领域本体新实例的各属性值信息。关系模式的准确率最高可达85%,达到了应用要求。 (4)提出了一种基于领域本体的查询扩展。利用领域本体对信息检索中用户输入的查询进行关键字扩展,增强了语义性,很大程度上提高了信息检索的查准率。经查询扩展后的平均查准率为85%,相比于未扩展前平均提高了41%。同时,将本文中提出的本体构建方法移植到其它领域中,验证了其领域适应性。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 邹心胜;;基于领域本体重用的机器翻译研究[J];情报科学;2011年06期
2 陈立峰;宋金玉;石坚;;军事通信领域本体构建与分析[J];计算机技术与发展;2011年07期
3 滕广青;毕强;;基于概念格的异构资源领域本体构建研究[J];现代图书情报技术;2011年05期
4 江潇俊;李善平;刘思屹;;基于本体的关联知识可视化检索模型[J];计算机工程;2011年16期
5 李杉;李兵;潘伟丰;侯婷婷;;一种mashup服务描述本体的自动构建方法[J];小型微型计算机系统;2011年09期
6 ;[J];;年期
7 ;[J];;年期
8 ;[J];;年期
9 ;[J];;年期
10 ;[J];;年期
11 ;[J];;年期
12 ;[J];;年期
13 ;[J];;年期
14 ;[J];;年期
15 ;[J];;年期
16 ;[J];;年期
17 ;[J];;年期
18 ;[J];;年期
19 ;[J];;年期
20 ;[J];;年期
中国重要会议论文全文数据库 前5条
1 王晓惠;王念滨;程慧;;基于本体的信息集成研究综述[A];黑龙江省计算机学会2007年学术交流年会论文集[C];2007年
2 王浩然;徐建良;张巍;;一种XML元数据的自动语义标注方法[A];2008'中国信息技术与应用学术论坛论文集(二)[C];2008年
3 马强;王连成;;基于XML的本体表示及建模研究[A];计算机技术与应用进展·2007——全国第18届计算机技术与应用(CACIS)学术会议论文集[C];2007年
4 王月;;基于本体的定检航材协同数据管理模型研究[A];2011年通信与信息技术新进展——第八届中国通信学会学术年会论文集[C];2011年
5 冯瑾;;初始领域本体获取研究——以国际共运领域为例[A];中国图书馆学会专业图书馆分会2009年学术年会论文集[C];2009年
中国博士学位论文全文数据库 前5条
1 于娟;基于文本的领域本体学习方法及其应用研究[D];大连理工大学;2010年
2 周栩;本体工程中若干问题的研究[D];吉林大学;2011年
3 米杨;基于顶级本体整合的医学领域语义标注研究[D];吉林大学;2012年
4 宋岩;基于多Agent和本体的散杂货港口集团船舶调度系统研究[D];北京交通大学;2011年
5 唐素勤;面向语义Web的描述逻辑本体构建[D];中南大学;2011年
中国硕士学位论文全文数据库 前10条
1 贾黎莉;Ontology构建中概念间关系的研究[D];中国农业科学院;2007年
2 李志;基于数据集成中本体自动构建的研究[D];中南大学;2005年
3 龚璇;基于关系数据库半自动生成局部本体的方法研究[D];武汉理工大学;2008年
4 龚雪;基于形式概念分析的本体学习方法研究[D];吉林大学;2009年
5 王长霞;语义Web服务中的领域本体半自动构建研究[D];大连海事大学;2009年
6 张囡囡;面向语义网的领域本体半自动构建方法的研究[D];大连海事大学;2008年
7 关淞元;本体匹配算法的研究[D];吉林大学;2009年
8 任柏青;基于关系数据库的领域本体构建方法的研究与实践[D];北京邮电大学;2009年
9 张福男;打印机领域本体的构建及应用研究[D];大连理工大学;2009年
10 李涵;本体构建及其在试题资源检索中的应用研究[D];河南大学;2008年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978