基于人工免疫的半监督学习模型的研究
【摘要】:
随着机器学习在数据分析和数据挖掘等问题中的广泛应用,作为模式识别和机器学习中重要的研究领域,半监督学习在理论和应用中也获得了长足的发展。半监督学习是在已知部分标注样本的情况下,同时利用已标注样本和未标注样本进行学习的一种学习算法。相比较于监督学习算法,它节省了标注样本所需要的大量成本,相比较于无监督来说,它保证了准确度。
以往的半监督学习方法中存在许多复杂的数学公式运算,计算起来往往比较复杂。近年来,基于生物系统的仿生机理越来越成为诸多领域的研究热点。像遗传算法、蚁群算法、粒子群算法等,都是对生物基本原理的研究,并逐渐将其应用到机器学习、模式识别等领域。将生物系统的某些原理运用到人工智能等领域,可以达到简化计算,操作简单,提高准确度等效果。
本文基于生物的免疫机制提出一种新的半监督学习算法。新算法将免疫系统中的抗原—抗体、免疫应答及免疫记忆等基本原理应用到半监督学习中,把免疫系统中的初始应答看作是训练阶段,二次应答看作是测试阶段,对训练样本通过进化学习算法进行学习,充分利用了免疫系统所具有的强大的信息处理能力,从而克服了传统半监督学习算法计算复杂的缺点。最后,通过在ORL人脸图像上的实验验证算法的可行性。实验结果表明,新算法具有很好的自学习、自组织、自适应能力,与基于人工免疫的监督学习算法相比,它节省了标注样本所需成本,在识别率方面也取得了很好的效果。