异构数据源集成及聚类挖掘的研究与应用
【摘要】:
随着信息技术的迅猛发展,各行业的信息量呈爆炸性增长,人们面对的信息呈现异构、海量、动态等特点,要想从这些信息资源中获得有用的知识,是一件极为困难的任务,同时也给异构数据挖掘带来巨大的挑战。因此,要解决异构数据挖掘中存在的问题,需要数据集成和数据挖掘技术相结合来消除“数据孤岛”并获得有价值的信息。这是目前研究数据挖掘系统迫切需要解决的问题,也是学术界与工业界关注的焦点。
论文将按照“研究-实现-应用”的思路,以异构数据源集成及聚类挖掘为研究基础,探讨这两种技术在网络游戏异构客户数据挖掘中的应用。论文首先对异构数据源集成及聚类挖掘进行概述,指出研究它们的必要性及它们之间的关联性;其次,对异构数据源集成及聚类挖掘展开研究,总结目前典型的异构数据源集成技术及聚类挖掘算法并分析它们的优缺点。以此为研究基础,从异构数据源集成的角度,给出了一种基于网格服务的异构数据源集成技术,着重对异构数据源集成的框架结构进行设计。从聚类挖掘算法的角度,给出了一种基于密度和栅格的聚类挖掘算法,着重对该算法的质量和时间效率进行分析,并通过实验数据集来验证算法的合理性和有效性;最后,将所给出的异构数据源集成技术及聚类挖掘算法应用于重庆某公司的网络游戏异构客户数据挖掘中,开发了网络游戏客户数据挖掘系统,该系统能够动态地集成网络游戏异构客户数据,并且能够根据游戏客户的消费行为对客户进行细分,识别出各类游戏客户消费行为的共同特性,为公司开展下一步精确化营销提供了决策支持。系统运行结果表明,网络游戏客户数据挖掘系统中所采用的异构数据源集成技术及聚类挖掘算法具有可行性和有效性。
通过以上研究,论文为异构数据源集成技术及聚类挖掘算法在网络游戏异构客户数据挖掘中的应用探索出了一条具有实际参考价值的新途径。