收藏本站
《浙江工商大学》 2007年
收藏 | 手机打开
二维码
手机客户端打开本文

基于统计视角的数据挖掘研究

徐雪琪  
【摘要】: 数据挖掘是一个年轻、活跃的研究领域,不同专业背景的研究者侧重于不同方面对数据挖掘展开了研究。从目前国内外的研究现状看,从事数据挖掘研究的主要是计算机领域的学者和专家,统计界的学者和专家对数据挖掘的研究相对较少。而随着数据存储技术的不断发展,可用于数据分析的数据量越来越大,对传统的统计分析技术提出了极大的挑战。笔者认为数据挖掘的出现,正是统计学适应这一变化的新的发展方向,数据挖掘并不是为了替代传统的统计分析技术,而是统计分析方法的延伸和扩展。本文从统计学视角研究数据挖掘,以期从统计学角度对数据挖掘理论的研究有所突破和创新,同时对统计学理论在数据挖掘方向的发展做出探索。 全文除了绪论,共分为七章。 第一章为:基于统计视角的数据挖掘理论体系研究。通过对数据挖掘与统计学理论基础、方法等方面的比较,清晰地提出了基于统计视角的数据挖掘体系,改变了目前研究中人们对统计学与数据挖掘之间理解的模糊认识。 第二章为:数据挖掘统计方法综述。首先对数据挖掘数据源、属性类型和功能三个基本问题作了界定,然后对实现其中的关联、聚类、分类和回归四项功能的统计方法进行综述,并对其中一些统计方法从数据挖掘应用角度作了一些完善和改进。 第三章为:数据挖掘统计方法进一步研究。主要进行了特征描述统计方法研究和聚类挖掘距离函数和相似系数研究。在特征描述统计方法研究中,提出了在本文设计的可视化数据挖掘系统LavaMiner中将把特征描述作为一个独立的挖掘功能模块来实现的思路,提出了特征描述过程模型,进而根据建立的过程模型系统地研究了各个步骤可采用的统计方法。在聚类挖掘距离函数和相似系数研究中,系统地研究了各类属性的距离函数和相似系数,并分析了各个距离函数和相似系数的优缺点或适用性。 第四章为:数据挖掘质量问题研究。从数据挖掘整个过程考虑把数据挖掘质量问题分为以下三类:源数据的质量问题、数据集成时的质量问题和数据分析时的质量问题,并针对不同问题从统计学的角度分别提出了相应有效的解决方法。 第五章为:可视化数据挖掘原型实现。首先从数据挖掘原型的应用场景、使用对象、过程模型和模型表示四个方面研究了数据挖掘原型设计基础,然后设计并部分实现了可视化数据挖掘原型系统LavaMiner,这是本文的另一项重要研究内容。该系统具有灵活的操作过程、便捷的扩展方式和全面的接口封装三大特点。 第六章为:数据挖掘在实际数据库上的应用示例。完成了数据挖掘在浙江省联通炫铃用户实际数据库中的应用示例,首先介绍了实验数据库,然后分不同时间段来实现最有价值客户的挖掘,最后作了铃音关联挖掘。 第七章为:全文总结及研究展望。主要对全文工作进行总结,并对下一步的研究作出展望。
【学位授予单位】:浙江工商大学
【学位级别】:博士
【学位授予年份】:2007
【分类号】:C812

手机知网App
【相似文献】
中国期刊全文数据库 前10条
1 石贵山;论相对数的平均数[J];辽宁广播电视大学学报;2000年03期
2 陈利昌;统计学课程教学改革实践与思考[J];高等农业教育;2001年07期
3 陈星;;参与性教学在高职院校统计教学中的应用[J];科技信息;2010年23期
4 王琳;;高职高专统计学教学特点浅析[J];英才高职论坛;2007年01期
5 张晓利;;浅谈统计学的产生与发展[J];科技信息;2011年14期
6 丁岚;关于“统计学”课程教学改革的设想[J];金融科学;1996年02期
7 ;统计学常用符号及含义[J];科技通报;2000年03期
8 ;统计学常用符号及含义[J];科技通报;2000年05期
9 李从珠,丁绍芳,王灵华,孙大宁;统计学在证券期货市场中的应用(Ⅰ)[J];数理统计与管理;2000年01期
10 Philip Ball ,刘道军;统计学:社会的物理学[J];世界科学;2002年08期
中国重要会议论文全文数据库 前10条
1 马杰;胡海峰;马玉书;;基于人工神经网络的数据挖掘工具[A];第十七届全国数据库学术会议论文集(技术报告篇)[C];2000年
2 马杰;刘月田;胡海峰;马玉书;;具有多种神经网络模型的数据挖掘工具[A];第十九届全国数据库学术会议论文集(技术报告篇)[C];2002年
3 邵华;万家华;王剑虎;何耀东;张霞;;一个以用户为中心的数据挖掘工具:Open Miner[A];第十七届全国数据库学术会议论文集(研究报告篇)[C];2000年
4 ;投稿须知:统计学[A];中华中医药学会老年神经病专题学术研讨会论文专辑[C];2006年
5 潘娥;;统计学案例教学初探[A];农业教育与农村改革发展——云南省农业教育研究会2007年学术年会论文汇编[C];2007年
6 潘宝骏;方林;;学术论文中若干统计学问题的编审[A];新世纪预防医学面临的挑战——中华预防医学会首届学术年会论文摘要集[C];2002年
7 陈震;陈维默;;浅谈数据挖掘技术[A];福建省科协第五届学术年会数字化制造及其它先进制造技术专题学术年会论文集[C];2005年
8 段军晓;;数据挖掘技术在民航快递市场营销中的应用[A];第六届中国科学家论坛论文汇编[C];2007年
9 李秀普;;医学期刊编辑对稿件中统计学问题的审查和表述[A];科技期刊编辑研究文集[C];1993年
10 崔海莉;袁兆山;;客户关系管理中的关联规则挖掘技术[A];计算机技术与应用进展——全国第17届计算机科学与技术应用(CACIS)学术会议论文集(上册)[C];2006年
中国重要报纸全文数据库 前10条
1 赵晨霞;时代发展需要强化统计学[N];发展导报;2003年
2 周东浩;个案与统计学[N];中国中医药报;2007年
3 本报记者 季晓莉;奥运会后国际交流将会更多[N];中国经济导报;2008年
4 ;21世纪统计学系列教材《〈统计学〉教学案例与教学项目汇编》[N];中国信息报;2004年
5 北京大学数学科学学院;统计学一代宗师———许宝騄 教授[N];中国信息报;2002年
6 刘庆;关于数据挖掘工具的讨论[N];网络世界;2006年
7 李成瑞;马克思对统计学的重要贡献被遗忘了吗?[N];中国信息报;2002年
8 沈若愚;设定超生抚养费不能无视统计学常识[N];东方早报;2007年
9 ;改革中发展壮大 为统计事业作贡献[N];中国信息报;2002年
10 倪小林;邱东:吃透国情再论中国经济是非[N];上海证券报;2007年
中国博士学位论文全文数据库 前10条
1 徐雪琪;基于统计视角的数据挖掘研究[D];浙江工商大学;2007年
2 鲁美君;基于古今医案数据分析的外感热病证治规律研究[D];黑龙江中医药大学;2008年
3 宋咏梅;失眠证方药证治规律研究[D];山东中医药大学;2004年
4 吴童;消渴病中医文献与证治方药规律研究[D];黑龙江中医药大学;2005年
5 封翠芸;糖尿病肾病中医药数据库建立及证治规律初探[D];广州中医药大学;2007年
6 潘月丽;小儿水肿文献及方药证治规律研究[D];山东中医药大学;2007年
7 艾丹祥;基于数据挖掘的客户智能研究[D];武汉大学;2007年
8 朱晓林;角膜炎中医文献及证治规律研究[D];山东中医药大学;2008年
9 王东梅;崩漏文献及方药证治规律研究[D];山东中医药大学;2006年
10 孙越恒;基于统计的NLP技术在中文信息检索中的应用研究[D];天津大学;2005年
中国硕士学位论文全文数据库 前10条
1 王平;统计方法在客户细分数据挖掘中的应用[D];华东师范大学;2009年
2 赵闪;数据挖掘在客户关系管理中的应用研究[D];广东工业大学;2007年
3 张志娟;基于Web服务和PMML的数据挖掘研究[D];大连海事大学;2008年
4 吕小雷;深意鞋业数据库营销研究[D];兰州大学;2008年
5 颜富强;遗传算法在数据挖掘中的应用研究[D];湖南大学;2008年
6 李政博;一种适用于领域专家的WEB数据提取的方法[D];吉林大学;2009年
7 王惠坡;基于决策树的货票数据挖掘系统的研究[D];郑州大学;2003年
8 杨志挺;分类和聚类在分析型CRM中的应用[D];国防科学技术大学;2004年
9 刘博;多用户在线可视化数据挖掘系统[D];河北大学;2006年
10 石义芳;数据挖掘技术在病人流量分析中的应用研究[D];暨南大学;2006年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026