自组织学习及其在汉字识别和图象分析中的应用
【摘要】:随着生物学、心理物理学对人类感知系统的深入了解,神经网络研究中以非监督学习、自组织的方式从现实世界提取特征并映射归类的机制引起了越来越大的关注。较之于已得到广泛应用的监督式学习算法,自组织学习具有好的生物可行性,能够在缺乏指导信息的情况下形成对输入数据的有效表征。
本文基于人的早期视觉模型,采用自组织学习的若干算法,做了以下三个方面的工作:
首先,我们尝试将一种线性主分量分析网络用于图象分割的实验,并参考视觉模型,引入了非线性机制大幅度地提高了算法收敛速度。
其次,我们采用一组Gabor滤波器作为视觉接受场,应用于手写体汉字识别中的特征提取过程。对得到的特征进一步运用自组织映射,并辅以监督式的学习过程构造特征映射码本,最后得到了较好的识别效果。
针对纹理图象分割的问题,我们也围绕Gabor滤波器及自组织映射,提出了一个综合纹理的频率信息和方向选择性的编码方案和计算模型。
最后,我们反过来研究以自组织学习机制获得类似Gabor滤波器的视觉感受场的问题。为此,我们提出了一个新的“自组织Hebbian学习”算法,并构造了一个多分辨率的图象金字塔用于学习。我们的实验表明,学习得到的感受场模板在空间频率和方向上都有一定的选择性。