基于数据仓库的决策树算法研究与应用
【摘要】:职业培训是人力资本形成的重要手段。我国的培训在实施上往往采用统一培训的方式,忽视了“因人施教”的培训理念,没有针对性,整体培训质量低。将数据挖掘应用于培训领域,抽取潜在的有用模式和隐藏的信息,可以为受训者提供个性化培训的依据,提升整体培训质量。
本文在对传统数据挖掘分类技术研究的基础上,分析培训领域特点,选择分类算法中的决策树算法进行该领域的数据挖掘。对决策树中的ID3算法进行深入研究,针对ID3算法的不足,结合国内外学者的一些研究成果,提出了一种新的属性选择算法。该算法在计算属性信息增益时,加入了属性取值个数和属性的类区分度,克服了ID3算法多值偏向及最优属性选择两方面的缺点,并通过一个实例和UCI数据集验证了改进算法的有效性。
最后,在邮政储蓄实训系统中构建数据仓库,与联机分析相结合,将改进后的算法应用于该系统,建立了决策树模型。
【学位授予单位】:西安电子科技大学
【学位级别】:硕士
【学位授予年份】:2010
【分类号】:TP311.13
【学位级别】:硕士
【学位授予年份】:2010
【分类号】:TP311.13
【相似文献】 | ||
|
|||||||||||||||||||||
|
|
|||||||||||||||||||||
|
|
|||||||||||||||||||||
|
|
|||||||||||||||||||||
|
|
|||||||||||||||||||||
|