领域本体的构建及其在信息检索中的应用研究
【摘要】:
作为北京邮电大学智能通信软件与多媒体北京市重点实验室科研项目——“基于Globus的分布式推理机研究”的前期工作,本文着重研究了领域本体的构建及其在信息检索中的应用。
随着网络信息的急增,信息检索工具将扮演着越发重要的角色。借助于信息检索工具,人们可以快速、准确地查找到所需的信息。查全率和查准率是衡量信息检索工具的重要标准,目前基于关键字的信息检索在查全率和查准率方面都有待提高。一方面,检索工具会返回大量无关的链接;另一方面,相当多的有效信息被检索工具遗漏了。为此,应该把信息检索从基于关键词的层次提高到基于概念的层次,同时应该对概念的相关性进行挖掘。而基于领域本体的语义检索正是实现这种提高的关键所在。
本文获得的主要研究成果有:
(1)针对已有本体建模方法的局限性,借鉴软件工程学中基于软件生命周期的建模理论,建立了电影本体的结构模型。提出了一种新的基于平面螺旋关系的本体知识存储机制,以降低查询构造的复杂度,提高查询扩展的效率。
(2)设计了基于电影领域本体的智能信息检索模型的三层体系结构,实现了查询生成,查询优化,匹配服务,检索结果序列优化等功能模块。
(3)提出了一种新的基于查询表达式与关系表互为映射的查询提炼算法,使得自然语言查询处理过程中避免引入复杂的分词环节,能够识别查询语句中的核心概念,有效地提高了查询效率。
(4)建立了基于本体的电影领域信息检索原型系统,充分利用本体在知识重用和共享上的优势,帮助用户从领域知识库中高效地获取专业信息。
(5)根据检索的结果与检索词的关联程度,提出一种新的基于本体加权语义树的相似度算法,使得检索的结果文档按照语义相关性从高到低排列。