收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

神经网络作为分类器的算法研究及在信息检索中的应用

周瑛  
【摘要】:本文以统计理论为基础,主要讨论在计算机上用软件模拟实现的神经网络分类器。在综述了神经网络作为分类器的研究现状及存在问题的基础上,着重对构造性学习方法中的覆盖算法进行深入的探讨和改进,以达到缩短学习时间、简化网络结构、提高分类精度的目的。主要的研究内容及创新如下: (1) 提出了覆盖算法的概率模型,并利用有限混合模型的极大似然拟合,用期望最大化算法对覆盖算法进行优化处理。将用原覆盖算法所得到的覆盖结果看作是一个预处理,将覆盖某一类样本的覆盖数看作是有限混合模型中的分量数目,解决了有限混合模型中分量数目难以估计这一难题,而不是主观地去估计分量的数目。某一类样本有多少个覆盖,就认为有限混合模型中的分量数目是多少,将覆盖某一类样本的每个覆盖看成一个Gauss分布,利用混合模型的极大似然拟合,用期望最大化算法来对覆盖算法进行优化处理。扩大了覆盖算法的应用范围,模拟结果表明新算法提高了测试精度。 (2) 对覆盖算法中的参数与测试精度的关系进行了研究。得出的结论如下:当原空间的k维样本向特征空间的k+1维投影时,超球半径的大小R与测试精度、拒识样本数之间几乎没有关系;对覆盖半径中参数n的取值与测试精度关系进行了研究,当n=1/2(即覆盖半径取同类样本中的最大距离与异类样本中的最小距离的算术平均)时测试精度达到了最高,这相当于SVM中的最优超平面;对覆盖算法中样本的学习顺序与网络性能的关系进行了分析实验,实验结果表明将样本按类别排序后所得到的网络,其性能比未排序时所得到的网络有不同程度的提高。 (3) 研究了覆盖算法中覆盖半径的大小与识别精度之间的关系。 本文提出通过扩大覆盖半径和加入异类点,来减少覆盖数目和隐层神经元个数,在网络规模尽可能小的情况下,虽然增加了有限的学习时间,但提高了学习的精度。实验证明PBCA对神经网络的训练是有效的。 在网络结构上,提出了由前馈网络和反馈网络组成的神经网络的混合结构。前馈网络完成样本的第一次分类,用反馈网络对边界样本或拒识样本进行第二次分类。


知网文化
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978