收藏本站
《武汉理工大学》 2007年
收藏 | 手机打开
二维码
手机客户端打开本文

基于Web的本体学习研究

傅魁  
【摘要】: 本体能够支持人机之间、机器之间的信息交换、知识共享与重用,而得到越来越广泛的重视、研究和应用。然而,领域本体的匮乏却是困扰本体理论研究与现实应用的最主要瓶颈之一,本体学习应运而生,它能够以自动或半自动化的机器学习方式从多种不同的数据源中获取本体。相比国外较多本体学习研究而言,中文环境下本体学习刚刚拉开序幕。本文通过对基于Web的本体学习的研究,为具有实用价值的中文本体学习系统的研发提供理论方法基础。 论文在借鉴国外现有的本体学习理论、方法和技术的基础上,结合中文自然语言处理的研究成果,对中文环境下领域本体的概念获取、继承关系学习、属性关系学习和本体实例获取的理论方法展开研究。论文主要研究内容如下: (1)通用本体学习系统的体系结构。设计了一种通用本体学习系统体系结构,由建立在资源层基础上的五大功能模块构成,分别为:资源管理模块、通用资源读写模块、数据预处理模块、本体抽取模块和本体评价与编辑模块。本文所提出的基于Web的本体学习的方法可组件式地无缝集成到该体系结构中。 (2)多策略领域概念获取。提出了一种融合信息抽取、中文自然语言处理、语言学和统计等多种策略的领域概念获取算法。能根据页面块特征判定结果自适应选择信息抽取或基于隐马模型和候选名词短语约简的术语获取方法,研究了基于搜索引擎的术语间同义词关系识别方法以及领域概念的过滤算法。 (3)继承关系学习。提出了基于Web分类目录判定的继承关系学习方法和基于语境自学习的继承关系学习方法。前者主要包括网页中Web分类目录判定算法、分类目录标注规则、隐式分类目录模式发现机制、标注文档合并中的歧义消解算法以及继承关系映像规则。后者主要包括继承关系语境的自学习机制和基于语境的继承关系获取算法。两种方法各有优缺点,具有互补性。 (4)基于知网的属性关系学习。属性关系具有重要作用,但研究很少。首先采用基于语境自学的方法获取候选属性集合;分析认为候选属性集合由非属性词汇、无效属性和有效属性构成,提出了利用知网中属性义原所描述的上下位关系实现非属性词汇过滤和利用属性一一宿主关系实现无效属性过滤的算法;研究基于领域概念树的实现属性关系映射与修剪的基本规则,设计了相应的算法。 (5)本体实例的获取。分析了Web网页中个体知识表示的主要形式,提出了基于本体的网页主题概念和个体知识表示特征的判定算法,重点设计了Web表格中本体实例获取的规则,包括本体实例表格识别规则、属性单元识别规则、属性值单元识别的基本规则和扩展规则、实例名称识别规则,给出了算法总体描述。
【学位授予单位】:

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 罗敏文;关于《中图法》二、三版变动类目所涉及的图书与分类目录的处理问题[J];图书馆;1991年03期
2 陈伟;《七略》与《汉书·艺文志》──我国古代图书分类目录的演进(之一)[J];昭乌达蒙族师专学报;1997年04期
3 宋凯;;搜索引擎[J];才智;2010年08期
4 ;“国外发光与电光”一九七四年分类目录[J];发光学报;1974年06期
5 李志清;;索书号与分类目录[J];晋图学刊;1987年03期
6 ;分类目录字顺主题索引试编研制总结报告[J];四川图书馆学报;1989年05期
7 陈壮;;浅谈档案分类目录中同类条目的排列[J];中国档案;1990年02期
8 江乃武;;刊次号研究简评[J];津图学刊;1997年01期
9 于艳东;姚玉阁;;搜索引擎原理浅析[J];集宁师专学报;2007年04期
10 谢茹芃;;中文网络分类目录分析与研究[J];科技情报开发与经济;2008年32期
11 范世伟;;分类目录的功用不应忽视,更不能取消[J];图书情报工作;1982年03期
12 卢子博;分类排架粗分,分类目录细分”是图书改编的一种好方法[J];图书馆;1991年06期
13 乔凤英张宏雯;浅谈细分类、粗排架[J];河北科技图苑;1998年01期
14 丁银燕,颜作辉;《四库全书总目》浅探[J];图书馆;2003年03期
15 李丽;戚桂杰;;从雅虎的分类目录分析信息构建的发展[J];情报理论与实践;2006年02期
16 程长源;;我对于编制主题目录的意见[J];中国图书馆学报;1958年04期
17 宋传山;谈谈分类目录主题索引的编制问题[J];四川图书馆学报;1980年03期
18 卢子博;;“双组类号制”方案初探[J];图书馆学刊;1981年03期
19 刘世杰;;介绍《名古屋市蓬左文库汉籍分类目录》[J];新世纪图书馆;1981年01期
20 刘家祜;;分类目录的主题索引编制法[J];河南图书馆学刊;1981年03期
中国重要会议论文全文数据库 前10条
1 ;《学术月刊》2002年分类目录[A];上海市社会科学界联合会2003年学术研讨会论文集[C];2003年
2 ;《学术月刊》2001年分类目录[A];上海市社会科学界联合会2002年学术研讨会论文集[C];2002年
3 杨丽鹏;林世平;;基于关联规则和自然语言处理技术的概念间非分类关系的抽取[A];2008通信理论与技术新进展——第十三届全国青年通信学术会议论文集(上)[C];2008年
4 陈慧清;林世平;;基于知网和模式自举的概念间分类关系获取方法[A];2009通信理论与技术新发展——第十四届全国青年通信学术会议论文集[C];2009年
5 刘柏嵩;高济;;通用本体学习框架研究(英文)[A];全国语域web与本体能研讨会论文集[C];2006年
6 ;分类目录——索引[A];上海市老科学技术工作者协会一、二、三届学术年会论文选集[C];2006年
7 史静;;中国地学索引的发展及现状[A];2005年中国索引学会年会暨学术研讨会论文集[C];2005年
8 徐惠;高志强;陆青健;朱万颖;;ORIGO:一种基于数字化图书馆资源的本体学习方法[A];2008'中国信息技术与应用学术论坛论文集(一)[C];2008年
9 陈哲;倪俊峰;;搜索引擎原理概述及其在星空黄页网站中的应用[A];2004年度中国索引学会年会暨学术讨论会论文集[C];2004年
10 李焯然;;丘浚著述考[A];明史研究论丛(第六辑)[C];2004年
中国重要报纸全文数据库 前10条
1 记者 李斌;信息产业部调整电信业务分类目录[N];计算机世界;2003年
2 ;平稳过渡 还要几年[N];中华工商时报;2003年
3 记者冉永平;第三代移动通信业务列入我国新电信业务分类目录[N];人民日报;2003年
4 布轩;信息产业部重新调整《电信业务分类目录》[N];通信产业报;2003年
5 翟文;哪些探矿权可以申请在先方式取得[N];地质勘查导报;2007年
6 张瑜;医疗器械产品类别重新界定[N];中国医药报;2002年
7 记者 吴岗;进一步规范矿业权出让管理[N];中国国土资源报;2006年
8 记者 史剑屏;增强监管透明性 引导市场有序竞争[N];人民邮电;2003年
9 记者 郑金雄;手机异地通话漫游费受质疑[N];人民法院报;2005年
10 中华人民共和国信息产业部;电信业务分类目录[N];人民邮电;2003年
中国博士学位论文全文数据库 前10条
1 傅魁;基于Web的本体学习研究[D];武汉理工大学;2007年
2 邱桃荣;面向本体学习的粒计算方法研究[D];北京交通大学;2009年
3 刘柏嵩;基于Web的通用本体学习研究[D];浙江大学;2007年
4 邢军;领域本体构造中数据源选取及构造方法的研究[D];大连理工大学;2008年
5 高俊杰;基于语义Web的企业知识集成关键技术研究[D];大连理工大学;2009年
6 于娟;基于文本的领域本体学习方法及其应用研究[D];大连理工大学;2010年
7 刘凯鹏;社会性标注关键技术及其在信息检索中的应用研究[D];哈尔滨工业大学;2010年
8 张春霞;领域文本知识获取方法研究及其在考古领域中的应用[D];中国科学院研究生院(计算技术研究所);2005年
9 梁浩;Deep Web信息集成架构及相关问题研究[D];吉林大学;2010年
10 陈一稀;基于关系数据库的遗留系统向语义Web移植的研究[D];浙江大学;2010年
中国硕士学位论文全文数据库 前10条
1 刘明生;粒计算及其在本体学习中应用的研究[D];南昌大学;2007年
2 龚雪;基于形式概念分析的本体学习方法研究[D];吉林大学;2009年
3 关庆珍;基于本体的个性化信息搜索的用户模型研究[D];西南大学;2008年
4 官莹莹;面向中文文本的本体学习方法研究[D];吉林大学;2009年
5 刘威;基于中文文本的本体构建方法研究[D];哈尔滨工程大学;2008年
6 何潇潇;结构化数据的本体获取[D];中国科学院研究生院(武汉物理与数学研究所);2006年
7 贾秀玲;面向文本的本体学习中概念提取及关系提取的研究[D];中南大学;2007年
8 王栋;基于Web挖掘的中文本体学习研究[D];太原理工大学;2007年
9 蔡元哲;本体实例学习关键技术的研究[D];中国人民大学;2008年
10 徐文海;文本单元向知识单元转化的模型与映射算法[D];西安电子科技大学;2008年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978