汉语认知脑数据挖掘相关算法及应用研究
【摘要】:研究脑、保护脑、开发脑、创造脑是人类二十一世纪最大的挑战之一。随着人类脑科学研究的深入展开,各种新方法、新技术的使用产生了大量数据。激增的数据背后隐藏着许多重要的信息,迫切需要提供一种自动的数据分析方法,对数据进行更高层次的分析,脑数据挖掘成为必然。
本文在人类脑计划和国家“973”等项目的资助下致力于汉语认知脑数据挖掘相关算法研究。首先,分别研究粒子群优化算法、粗糙集、人工神经网络的理论与应用;然后,结合脑结构和功能以及汉语认知实验数据特征,研究基于粒子群算法的粗糙集神经网络数据挖掘方法;最后,对脑成像特征增强、特征提取等算法与所研究的数据挖掘算法进行集成研究,并将其应用于汉语认知神经信息学研究中的脑数据挖掘。这项研究具有浓重的中国特色和优势,将不仅为汉语认知脑研究提供有效的手段,而且对人工智能的研究具有重要的理论价值。全文具体从以下几个方面展开:
粒子群优化算法是简单个体组成的群落以及个体之间的互动行为模拟搜索全局最优解的群智优化方法。本文对粒子群优化算法的机理及其收敛性进行分析,指出粒子群优化算法满足收敛性的前提下种群多样性就会减小,粒子将会因速度降低而失去继续搜索可行解的能力,粒子群优化出现停滞状态,这种情况大多导致早熟。为此,提出一种混沌粒子群优化算法,该算法满足收敛性的条件下利用混沌确定性与随机性的统一、对初始值敏感性、混沌的遍历性等特点引导粒子群中的粒子搜索,提高种群的多样性和粒子搜索的遍历性,将混沌状态引入到优化变量,使因速度降低而失去搜索可行解能力的粒子引入混沌量后获得继续索的能力,避免粒子搜索过程中容易发生的早熟、停滞,提高粒子的搜索效率,改善粒子群优化的性能。
粗糙集理论知识约简的复杂度随着决策表的增大呈指数增长,许多约简方法引入启发式搜索方法寻找较优的约简,主要通过可辨识矩阵中0和1的个数进行处理和计数来实现的,在初始化和迭代的过程需要不断地检验新生成的个体是否存在于解空间(可辨识矩阵),而且通常倾向于在同一基础解系中搜索可行解。粗糙集约简实质是找到所含条件属性最少的条件属性子集与决策属性匹配,提出一种基于离散型粒子群优化的粗糙集数据约简算法,有效避免约简过程中