贝叶斯网络分类器与应用
【摘要】:贝叶斯网络是一种描述随机变量之间依赖关系的图形模式,是概率理论和图形理论的结合,是不确定性知识表示和推理的有力工具,已在许多领域得到了广泛的应用。基于贝叶斯网络可以进行联合概率的条件和边缘分解,从而能够有效降低运算复杂度、解决与联合概率计算有关的一系列问题。用于分类预测的贝叶斯网络通常称为贝叶斯网络分类器。
朴素贝叶斯分类器是一种基础的贝叶斯网络分类器,以简单、高效和良好的分类准确性而著称,但这种分类器基于一个很强的条件独立性假设,使得属性之间的依赖信息无法得到有效的利用,而这部分信息往往也是分类的重要信息。本文从朴素贝叶斯分类器的扩展、优化和应用等方面,对选择性朴素贝叶斯分类器(SNB)、树扩展的朴素贝叶斯分类器(TAN)、K依赖扩展的朴素贝叶斯分类器(KDB)、贝叶斯网络扩展的朴素贝叶斯分类器(BAN)、完全贝叶斯分类器(CBC)、贝叶斯网络分类器的参数集成(Boosted-NB)与动态朴素贝叶斯分类器进行了研究。
本文主要研究内容如下:
(1)研究了朴素贝叶斯分类器在处理连续和离散属性时的不同方法,介绍了特征子集选择以及基于高斯和高斯核函数估计属性条件密度的朴素贝叶斯分类器。
(2)详细介绍了朴素贝叶斯的依赖扩展分类器的研究发展脉络,对几种典型的朴素贝叶斯扩展分类器(比如树扩展朴素贝叶斯分类器TAN、K依赖朴素贝叶斯分类器、基于类约束的贝叶斯网络分类器)的特点进行分析,指出了各自具有的优点和不足。
(3)给出了朴素贝叶斯分类器在企业财务风险预警、操作风险预警和高校教师科研能力评估方面的应用。
(4)将朴素贝叶斯分类器与时间序列相结合得到动态朴素贝叶斯分类器,提出了动态朴素贝叶斯分类器的特征子集选择方法,验证了此方法的有效性。并给出动态朴素贝叶斯分类器在经济增长和商品进出口影响分析方面的应用。