基于遗传算法的BP神经网络在网络数据抓取中的研究
【摘要】:
人工神经网络(Artificial Neural Network)是一种旨在模仿人脑结构及其功能的信息处理系统,它是对人脑神经网络的简化、抽象与模拟。目前已有上百种的人工神经网络模型,这些简化模型能反映出人脑的许多基本特性,它们在模式识别、系统辨识、信号处理、自动控制、预测估计、故障诊断等领域已成功解决了许多现代计算机难以解决的实际问题,表现出良好的智能特性和潜在的应用前景。
BP (Error Back-Propagation)神经网络,即误差反向传播神经网络,是目前应用最为广泛和成功的人工神经网络之一,它通过误差反向传播实现了对网络权重的调整。BP神经网络应用非常广泛,但也存在许多缺点,如训练速度慢、难以确保收敛性、易陷于局部极小、规模受限等问题。遗传算法(Genetic Algorithm)是一种模拟自然界遗传进化过程的一种算法模型。遗传算法以其易于实现、能快速搜索全局最优解等优点,被广泛运用于各种实际问题的解决中。因此,本文将遗传算法与BP神经网络相结合,利用遗传算法对BP神经网络进行优化,提出基于遗传算法的BP神经网络。
本文中将基于遗传算法的BP神经网络应用于网络数据抓取中,通过对它进行有监督的训练,实现对抓取数据的快速准确的识别和抓取,在抓取过程中,采用赌轮选择和精英选择相结合的方法来设计遗传算法,同时使用自适应学习率的方法来设计BP神经网络,通过对改进网络的训练结果的分析,可以得出结论,基于遗传算法的BP神经网络不仅有很快的训练速度,而且在一定程度上克服了BP神经网络易陷入局部极小值的缺点,在对网络数据抓取的过程中,提高了数据抓取的速度和准确性。