智能协同算法研究及应用
【摘要】:近年来,随着智能化时代的来临,人工智能算法的应用逐渐成为各个领域中研究的热点技术。作为人工智能领域的重要内容之一,智能协同试图通过研究先进的智能算法,使得多智能体具有高效的协作能力。对智能协同算法的研究给人工智能、现代优化及机器学习等理论的发展带来了新的挑战,与此同时,这些理论和技术上新的发展又可以应用到智能协同系统中,这也是对其应用领域的进一步扩展和完善。智能协同的核心是多智能体通过有效的协同控制以达到整体效能最优。本文综合利用计算智能相关理论,对智能协同系统中的若干关键技术问题展开研究,研究智能协同中的碰撞避免、协同任务分配和协同路径规划等问题,为未来智能协同控制提供技术支持。无论从科学角度还是理论价值上来说,都具有极强的研究意义和实用价值。本文的主要研究内容包括以下四部分:(1)动态环境下碰撞避免。在传统强化学习的基础上,提出了一种改进强化学习算法并将其应用于动态环境下机器人实时碰撞避免问题中。并对其算法原理进行了分析。算法中将动态障碍物的运动方向加入到状态空间的定义中来消除Q值更新产生的歧义。为了增加最优解的多样性,在策略选择中,将?-贪心策略和“近目标”策略两种策略结合来为机器人选择下一步动作。此外,算法中重新定义了回报函数使其更加合理且使机器人尽可能快地到达目标,并利用遗传算法对回报函数进行了优化。通过这些改进,所提算法在解决实时避障问题时的成功率与传统强化学习算法相比有了巨大的提升。(2)多智能体防守对抗。在深度强化学习的基础上,研究并提出了一种高效的多智能体协同算法,并在防守对抗问题上进行了验证。针对传统强化学习算法不能解决连续空间问题的缺陷,算法通过巧妙的设计对防守对抗问题建立模型并构建相应的状态空间、动作空间、回报函数等。然后利用学习算法对防守智能体和攻击智能体进行训练,并重新生成新的环境对学习效果进行测试。算法不仅能够有效解决攻击智能体规则运动的情况,同时对攻击智能体智能化的情况也具有很高的效率。此外,本文中也进行了与其他学习算法的对比,更进一步说明了所提方法的性能。(3)协同任务分配。通过对机器学习方法中的交叉熵算法进行深入分析,提出了一种基于交叉熵的方法并将其用于多无人机协同任务分配问题中。交叉熵方法初始被应用于复杂网络中小概率事件的估计,而协同任务分配问题在本质上属于组合优化问题。文中阐述了二者之间的联系,并给出了将交叉熵方法用于组合优化问题的公式推导。算法中首先根据任务所需资源数量确定可行分配方案的数量,然后提出整体方案评估标准,并利用交叉熵方法得到具有最高得分的最优分配方案。(4)协同路径规划。考虑了多种类型的威胁源,对其进行了不同的处理,并通过Voronoi图的方法构建环境模型。在多无人机初始路径规划中,对经典蚁群算法进行改进,重新定义启发式信息函数和信息素更新方法。为了满足规划路径的可飞性需求,提出了k-degree平滑算法并分析证明了其原理。在平滑算法的基础上,提出了多无人机协同的策略,满足多无人机同时到达目的地,或在一个可接受的时间区间内到达目的地,有效解决多无人机协同路径规划问题。