收藏本站
《国防科学技术大学》 2005年
收藏 | 手机打开
二维码
手机客户端打开本文

面向中文文本的本体构建和自动扩充

唐晋韬  
【摘要】:语义Web是Internet发展的重要趋势,其目的之一在于赋予万维网上所有资源唯一的标志,并在资源之间建立机器可处理的各种语义联系。语义万维网以明确的、形式化的方式来表示信息资源,能够提高异构系统的互操作性,促进知识共享和信息处理技术的发展。而本体作为语义Web的一个重要服务层,在基于内容的访问、互操作和通信中扮演了核心的角色。 本体是从哲学研究中发展出来的概念,在计算机领域,本体是用于描述或表达某一领域知识的一组概念或术语,可用于组织知识库较高层次的知识抽象,也可用来描述特定领域的知识。 目前本体构建和本体自动扩充的研究在语义Web领域越来越受到重视。许多研究者都提出了在各自的应用领域适用的一些本体构建方法,也有研究者在逐步地丌始研究如何从文本中挖掘本体和扩充本体实例。但这些方面的研究都还处于一个很不成熟的阶段。这不仅仅与目前的处理技术水平相关,更多的是因为目前语义Web的研究处于起步阶段,在本体的构建等理论方面还有许多重要的问题有亟待深入研究。 本文在对前人的工作进行分析和综合的基础上,研究了一种适合较小领域本体建立的本体构建方法,并对中文时间描述进行深入的分析,设计了一种时间本体结构,并构建了面向中文的时间本体。在此基础上,本文进一步进行了本体自动扩充的实验,采用有监督的SVM算法进行时间实例分类。针对中文时间描述的特点,本文选择了词汇特征和词法特征来构造特征向量。针对基于本体的信息抽取的特点,特别是本体的自动扩充问题,本文在分析目前流行的几种分类策略的基础上,对基于SVM二类分类器构造多类分类器的问题进行了研究,设计了一个基于本体概念体系的多类分类策略。本文测试了不同的分类策略和核函数对分类结果的影响,实验结果表明,相对于其它的常用多类分类策略,本文的多类分类策略在时间本体自动扩充任务中表现出较好的性能。
【学位授予单位】:国防科学技术大学
【学位级别】:硕士
【学位授予年份】:2005
【分类号】:TP391.1

手机知网App
【相似文献】
中国硕士学位论文全文数据库 前3条
1 唐晋韬;面向中文文本的本体构建和自动扩充[D];国防科学技术大学;2005年
2 刘威;基于中文文本的本体构建方法研究[D];哈尔滨工程大学;2008年
3 陈建美;中文情感词汇本体的构建及其应用[D];大连理工大学;2009年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026