收藏本站
《吉林大学》 2017年
收藏 | 手机打开
二维码
手机客户端打开本文

政府网站信息资源多维语义知识融合研究

黄新平  
【摘要】:近年来,我国政府信息公开工作进展迅速,越来越多的政务信息资源通过政府门户网站发布,这些信息涉及到各个领域,关系到国计民生和群众的切身利益,群众对其有着广泛的需求。然而由于政府机构的层次性,且行政机关的隶属不同、分工不同,造成政府网站发布的公开信息具有层次性、地域性、分散性等特点,这些海量的、孤立的、分散状态存在的碎片信息往往使人们束手无策,给公众获取有效信息造成障碍,影响政府公开信息的有效利用。政府网站信息资源数量的急剧增长在为人们获取所需的信息和知识带来更多机遇的同时也带来了更大的挑战。因此面对“信息海洋”与“知识匮乏”的对峙局面,迫切需要采取一定的方式和手段对多来源、多类型的政府网站信息资源进行类聚、重组和融合,构建一个有序高效的政府信息知识体系,为用户提供知识的有效获取与利用。知识融合能够针对多源分布信息的碎片化、冗余性、不完整性等问题,从众多数据源中抽取相关知识,经过知识转换、集成与合并等处理,产生新的集成化知识对象,从而为领域决策问题求解构造有效的知识资源。它为解决政府网站信息资源领域的知识服务问题提供了新思路、新方法和新途径。本文以实现政府网站信息资源的深层次开发和利用为立足点,以满足公众的高效率知识服务为目标,综合运用信息管理学、计算机科学、知识科学、系统科学等多学科的理论方法,拟从知识组织的角度架构政府网站信息资源知识融合框架模型,试图改变知识获取的固有流程,形成新的知识获取过程模型,提出对多源的、分散重复、被淹没的政府网站信息资源进行知识融合的理论框架与解决方案。在此基础上,以语义网、知识本体、知识发现等语义信息组织技术为支撑,尝试在语义环境下分别从内容维度、结构维度、应用维度三个不同维度探索政府网站信息资源知识融合的实现方法。具体研究内容包括:(1)通过对政府网站信息资源和知识融合等相关概念的阐述,进一步明晰了本文研究对象与研究内容的范畴。同时对本研究具有重要指导意义和参考价值的知识空间理论、知识组织理论、本体理论、知识发现理论进行了理论溯源。其中,知识空间多维度的知识分类与知识管理为本文政府网站信息资源多维度知识融合框架的构建提供了重要的理论支撑。知识组织理论对确定不同维度层级政府网站信息资源知识融合所需要实现的知识表示、知识重组、知识关联、知识聚类等过程具有重要的理论指导作用。本体是实现政府网站信息资源知识融合的有力工具,而知识发现理论则提供了解决政府网站信息资源知识融合问题的技术方案。(2)确定了政府网站信息资源知识融合的目标和原则,从用户信息需求和知识融合功能需求两个方面分析了知识融合需求,明确了知识融合的流程与体系结构等框架构建依据。然后对语义环境下政府网站信息资源知识融合过程中涉及的构成要素、功能要素及要素之间的关系进行了分析,并依此提出了基于语义的政府网站信息资源知识融合逻辑框架,从概念与逻辑层面回答了政府网站信息资源知识融合“做什么”的问题。在提出的基于语义的政府网站信息资源知识融合逻辑框架的基础上,以知识空间理论多维度的知识分类与知识管理,知识融合研究领域对知识类型的划分,以及信息融合研究领域中多源信息融合系统的结构与功能框架为依据,提炼出了由数据级融合、概念级融合、决策级融合构成的知识融合功能结构,并依此分别从内容维度、结构维度、应用维度三个维度构建了政府网站信息资源多维度知识融合框架,从结构与功能层面回答了政府网站信息资源知识融合“怎么做”的问题。(3)内容维度上数据级融合要解决的关键问题是如何对描述统一的政府网站信息资源内容进行有效的数据关联,通过数据关联,形成知识网络。为此,本文通过对特定主题政府网站信息资源进行细粒度信息抽取、预处理,采用本体驱动的元数据模型对其进行统一的语义描述,构建了政府网站信息资源领域知识本体,并以语义网络表示法为参考,实现了政府网站信息资源的知识表示。在此基础上,引入知识元、知识元—本体映射的概念,利用基于知识元语义链接的数据关联方法实现知识元的统一对象化表示、知识元对象的抽取、知识元对象的属性获取、知识元语义关联度计算等,并依此构造生成对特定主题资源内容进行宏观描述的知识网络。(4)结构维度上概念级融合要解决的关键问题是如何从数据级融合生成的政府网站信息资源知识网络中获取领域概念,并识别领域本体概念关系,通过本体合并,形成能够便于发现彼此间关联规则和模式的分类知识组织体系。针对该问题,本文提出了采用RDF链接定性推理与Voronoi图定量推理相结合的本体形式化表示方法来获取政府网站信息资源领域概念。通过识别领域本体概念关系,构建领域本体概念关系的层次结构,依此获得领域本体概念分类体系。在此基础上,设计基于概念分类的领域本体映射模型,并采用本体概念间语义相似度的计算方法,实现基于概念分类的政府网站信息资源领域知识本体合并,消除政府网络信息资源知识网络中的冗余知识,达到对其进行有效分类组织的目的。(5)应用维度上决策级融合要解决的关键问题是如何对政府网站信息资源知识网络和分类知识组织体系结构中具有关联关系和相似关系的领域知识进行关联聚类,经过知识关联聚类,生成面向决策应用的完整领域知识。基于此问题,本文通过对已有领域知识关联聚类方法进行比较分析,提出基于关联挖掘和语义聚类的领域知识融合方法,该方法涵盖时序关联融合、因果关联融合、凝聚层次聚类融合3种核心领域知识融合算法,进而通过因果关联、时序关联、知识聚类等方法生成能够辅助用户决策的完整领域知识。(6)前文按照政府网站信息资源多维度知识融合框架的结构与功能划分,提出了不同维度层级知识融合实现所需要的方法,这些方法的效果如何,还需要通过实验进行验证。为此,本文搭建了实验所需的软硬件环境,介绍了实验需要应用到的相关工具。对实验数据来源及其主题分布情况进行了描述,明确了不同维度层级知识融合的实验内容。在具体的实验验证上,以政府网站发布的“雾霾防治”主题相关的领域信息资源为例,构建了政府网站“雾霾防治”领域知识本体实例。并以构建的“雾霾防治”领域知识本体为依据,分别对数据级融合提出的基于知识元语义链接的知识网络实现方法、概念级融合提出的基于概念分类的领域知识本体合并方法以及决策级融合提出的基于关联挖掘和语义聚类的领域知识融合方法进行了实验验证,并通过设计定性与定量相结合的评价指标对案例实验结果进行了分析与评价。
【关键词】:政府公开信息 政府网站 网络资源 语义 知识融合
【学位授予单位】:吉林大学
【学位级别】:博士
【学位授予年份】:2017
【分类号】:D63;G203
【目录】:
  • 摘要4-7
  • Abstract7-17
  • 第1章 绪论17-39
  • 1.1 选题背景及研究意义17-19
  • 1.1.1 选题背景17-18
  • 1.1.2 研究目的18
  • 1.1.3 研究意义18-19
  • 1.2 国内外相关研究综述19-33
  • 1.2.1 政府网站信息资源研究现状19-22
  • 1.2.2 政府信息资源知识组织研究现状22-23
  • 1.2.3 知识融合研究进展23-33
  • 1.2.4 研究现状述评33
  • 1.3 研究内容与创新点33-36
  • 1.3.1 主要研究内容33-35
  • 1.3.2 论文创新点35-36
  • 1.4 研究方法和技术路线36-39
  • 1.4.1 研究方法36-37
  • 1.4.2 技术路线37-39
  • 第2章 相关概念与理论基础39-70
  • 2.1 概念界定39-45
  • 2.1.1 政府网站信息资源的范畴39-41
  • 2.1.2 知识融合的概念辨析41-45
  • 2.2 知识空间理论45-51
  • 2.2.1 知识空间的内涵45-47
  • 2.2.2 知识空间的维度分析47-49
  • 2.2.3 知识空间的知识分类49-50
  • 2.2.4 知识空间的知识管理50-51
  • 2.3 知识组织理论51-59
  • 2.3.1 知识组织的概念51-52
  • 2.3.2 知识组织体系与模式52-55
  • 2.3.3 知识组织过程与方法55-59
  • 2.4 本体理论59-66
  • 2.4.1 本体的概念演变59-60
  • 2.4.2 本体的组成要素与逻辑结构60-62
  • 2.4.3 本体的分类62-63
  • 2.4.4 本体描述语言与编辑工具63-65
  • 2.4.5 本体在图书情报领域的应用65-66
  • 2.5 知识发现理论66-69
  • 2.5.1 知识发现的定义66-67
  • 2.5.2 知识发现的流程67-68
  • 2.5.3 知识发现的技术68-69
  • 2.6 本章小结69-70
  • 第3章 政府网站信息资源多维度知识融合框架70-91
  • 3.1 政府网站信息资源知识融合目标与架构70-78
  • 3.1.1 知识融合目标和原则70-73
  • 3.1.2 知识融合需求分析73-75
  • 3.1.3 知识融合流程与体系结构75-78
  • 3.2 政府网站信息资源知识融合逻辑框架78-84
  • 3.2.1 知识融合的要素分析78-81
  • 3.2.2 知识融合的要素关系81-82
  • 3.2.3 知识融合逻辑框架构建82-84
  • 3.3 政府网站信息资源知识融合维度框架84-90
  • 3.3.1 知识融合的维度划分84-85
  • 3.3.2 知识融合的维度关联85-87
  • 3.3.3 知识融合维度框架构建87-90
  • 3.4 本章小结90-91
  • 第4章 内容维度:面向广义知识的数据级融合91-130
  • 4.1 政府网站信息资源采集与预处理91-103
  • 4.1.1 网络资源定题采集91-100
  • 4.1.2 网页资源主题信息提取100-101
  • 4.1.3 网页资源主题特征分析101-103
  • 4.2 政府网站信息资源本体建模与知识表示103-122
  • 4.2.1 本体驱动的政府网站信息资源元数据模型103-111
  • 4.2.2 政府网站信息资源领域知识本体构建111-119
  • 4.2.3 政府网站信息资源的知识表示119-122
  • 4.3 基于知识元语义链接的政府网站信息资源知识网络构建122-129
  • 4.3.1 知识元素的统一对象化表示122-125
  • 4.3.2 知识元对象间的语义知识链接建立125-126
  • 4.3.3 基于知识元语义链接的知识网络实现126-129
  • 4.4 本章小结129-130
  • 第5章 结构维度:面向分类知识的概念级融合130-157
  • 5.1 政府网站信息资源领域概念获取130-139
  • 5.1.1 领域概念的内涵与分类130-131
  • 5.1.2 常用领域概念获取方法及其比较131-134
  • 5.1.3 基于本体形式化表示的领域概念获取方法134-139
  • 5.2 政府网站信息资源领域本体概念关系识别139-148
  • 5.2.1 领域本体概念关系类别139-141
  • 5.2.2 领域本体概念关系的抽取141-146
  • 5.2.3 领域本体概念关系的层次结构146-148
  • 5.3 基于概念分类的政府网站信息资源领域知识本体合并148-156
  • 5.3.1 领域本体概念分类体系149-150
  • 5.3.2 基于概念分类的领域知识本体映射模型150-153
  • 5.3.3 领域本体概念间语义相似度的计算方法153-156
  • 5.4 本章小结156-157
  • 第6章 应用维度:面向关联聚类知识的决策级融合157-184
  • 6.1 政府网站信息资源领域知识的关联聚类过程与方法157-168
  • 6.1.1 领域知识挖掘和推理方法选择157-162
  • 6.1.2 领域知识关联方法及其应用162-166
  • 6.1.3 领域知识聚类的实现方法与比较166-168
  • 6.2 基于时序关联的领域知识融合方法168-174
  • 6.2.1 时序关联规则定义169-170
  • 6.2.2 时序关联融合算法描述170-174
  • 6.3 基于因果关联的领域知识融合方法174-178
  • 6.3.1 因果关联融合的相关概念174-176
  • 6.3.2 因果关联融合算法思路176-178
  • 6.4 基于凝聚层次聚类的领域知识融合方法178-183
  • 6.4.1 凝聚层次聚类融合算法的数学描述179-181
  • 6.4.2 凝聚层次聚类融合算法的实现过程181-183
  • 6.5 本章小结183-184
  • 第7章 实证研究——以政府网站“雾霾防治”领域知识为例184-204
  • 7.1 实验环境184-189
  • 7.1.1 硬件环境184-185
  • 7.1.2 软件环境185
  • 7.1.3 相关工具185-189
  • 7.2 数据准备和实验内容189-190
  • 7.2.1 实验数据来源和描述189
  • 7.2.2 实验内容189-190
  • 7.3 实验分析190-203
  • 7.3.1 政府网站“雾霾防治”领域知识本体实例构建190-193
  • 7.3.2 数据级融合方法实验结果及评价193-195
  • 7.3.3 概念级融合方法实验结果及评价195-198
  • 7.3.4 决策级融合方法实验结果及评价198-203
  • 7.4 本章小结203-204
  • 第8章 研究结论与展望204-209
  • 8.1 研究结论204-207
  • 8.2 研究展望207-209
  • 参考文献209-223
  • 攻读博士学位期间的主要科研成果223-224
  • 致谢224

中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026