基于粒子群优化算法的Web挖掘技术的研究
【摘要】:随着计算机技术在各领域的广泛应用,互联网的迅猛发展又使得各类信息以指数级增长,面对GB级及TB级的数据,如何处理便成为当今数字化社会面临的一个极具挑战性的问题。数据中蕴含的价值正在被越来越多的人所关注和研究,挖掘其中的价值知识,成为了必然需求。Web数据挖掘所涉及到的数据主要有Web内容、Web结构、Web使用记录、用户的背景信息、交易信息、查询信息等。然而这些数据往往具有分布性、异构性、稀疏性、高维性及海量性等特征,因此分布式Web数据挖掘日益受到关注。
粒子群优化算法是通过粒子间的竞争和协作以实现在复杂搜索空间中寻找全局最优解。它具有易理解、易实现、全局搜索能力强等特点,倍受科学与工程领域的广泛关注,已经成为发展最快的智能优化算法之一。正由于该算法的这些特点,使得它在Web数据挖掘中具有较大的优势。本文主要研究该算法在Web数据挖掘中的应用,介绍了粒子群优化算法进行Web数据挖掘的基本原理,分析了其特点。全面综述了粒子群Web数据挖掘优化算法的原理、特点、参数设置与应用等,重点分析了粒子群优化算法中的惯性权值,加速因子的设置对算法基本性能的影响,给出了算法中的经验参数设置。最后对其未来的研究提出了一些建议及研究方向的展望。