收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

多指标综合评价的非参数方法和缺失数据的聚类方法研究

骆汝九  
【摘要】:多指标综合评价概指对以多属性体系结构描述的对象系统做出全局性、整体性的评价,是利用数学及统计方法,将反映评价对象不同属性的多个统计指标的信息转化成无量纲的相对评价值,并综合这些评价值以求得评价对象的优劣等级的一种评价方法。综合评价方法的研究一直是评价研究领域中的热点问题。论文对多指标综合评价方法进行了概述,重点介绍了属于运筹学和其它数学方法范畴的几种常用的综合评价方法,包括层次分析法(Analytic Hierarchy Process, AHP)、模糊综合评判法(Fuzzy Comprehensive Evaluation,FCE)、数据包络分析法(Data Envelopment Analysis,DEA)、灰色综合评价法(Grey Comprehensive Evaluation)、 TOPSIS评价法(Technique for order preference by similarity to ideal solution)等,从综合评价方法的概念和原理、模型和步骤、优缺点评析等方面作了较为详细的阐述。最后讨论了评价方法的集成、存在的问题及研究趋势。 聚类分析是研究分类问题的一种多元统计分析方法,是一种重要的数据分析手段。它把一个没有类别标记的数据集按照某种相似性准则划分成若干个子集(类)。聚类的主要依据是类内对象的相似性尽可能大,而类间对象的相似性尽可能小。通过聚类分析,能有效地发现隐含在数据集中的数据分布特性和典型模式,从而为进一步充分、有效地利用数据奠定良好的基础。聚类分析现已成为数据挖掘中的一项重要技术和主要方法之一。多年来,众多学者对聚类算法进行了广泛而深入的研究。论文对基于划分的(partitioning method)、基于层次的(hierarchical method)、基于密度的(density-based method)、基于网格的(grid-based method)和基于模型的(model-based method)五大类聚类算法进行了综述,并在每一类中,介绍了一些经典的聚类算法。 在此基础上,论文针对多指标综合评价结果的差异显著性测验以及缺失数据聚类的统计分析两个问题开展了初步研究,主要结果如下: (1)发展了一种多性状综合评价的统计假设测验方法(非参数的秩和与秩和差测验) 目前国内外关于多性状综合评价的方法很多,但它们都只是提供了各不相同的优劣判别方法,其评价结论表现为一定的综合评价值以及相应的优劣排序,而无法提供各评价对象与其平均水平的差异显著性。论文给出了一种多性状综合评价的统计假设测验方法(非参数的秩和测验),在“H0:各评价对象在各性状上的秩次随机分布”假设下,导出多性状秩和的理论分布,并据之提出获得秩和测验显著性临界值的一般化方法及计算程序。通过定义任意长度整数C++运算律,解决了当评价对象和性状数较多时,因常用软件内置数据类型有效位数不足所导致的计算误差问题。最后,以糯玉米12个品种5个淀粉粘度性状为例演示了分析程序。 以上多性状综合评价的秩和测验方法,虽可测验各评价对象与其平均水平的差异显著性,但无法实现各评价对象两两之间的差异显著性测验。论文以秩和理论分布为基础,利用组合数学方法,进一步导出了多性状秩和差的理论分布,并据之给出了多性状综合评价秩和差测验的显著性临界值。通过秩和差测验,确定评价对象两两之间的差异显著性,从而实现评价对象间的多重比较。 (2)给出了一种带有缺失数据的基于模型的动态聚类方法 聚类分析是把数据集中的对象按某种相似性准则聚集成多个类的多元统计分析方法。通常情况下,聚类过程需要基于完全数据集,但在许多实际问题的研究中,其数据是不完全的,这给聚类分析带来一定的困难。论文研究了带有缺失数据的基于模型的动态聚类方法,利用相关变量的辅助信息,对缺失数据进行推估,确定其合理的替代值,从而构造出一个“完全”数据集。在此基础上以EM算法循环迭代,参数的估计值和缺失数据的替代值都将逐渐收敛,以相应的贝叶斯后验概率判别个体的归类,进而实现动态聚类。模拟研究表明,缺值替代法具有较好的收敛性,对有缺失的数据基本都可正确地聚类。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 周伟萍;张德然;杨兴琼;;具有部分缺失数据时两个几何总体的估计[J];长春大学学报;2008年02期
2 廖慧敏;林燧恒;;数据缺失机制对逐步回归变量筛选的影响[J];中国卫生统计;2011年04期
3 李开灿;有缺失数据的2×2×2列联表的参数估计[J];数理统计与管理;2003年02期
4 孙凤;;微观计量分析中缺失数据的极大似然估计[J];数量经济技术经济研究;2005年11期
5 李佳宁;;有缺失数据的双向有序方列联表统计推断[J];大连交通大学学报;2007年02期
6 庞新生;;分层随机抽样条件下缺失数据的多重插补方法[J];统计与信息论坛;2009年05期
7 赵慧秀;马文卿;;带有缺失数据的估计方程[J];曲阜师范大学学报(自然科学版);2009年03期
8 裴晓换;任娜;付小君;;具有缺失数据的2个几布总体的估计和检验[J];纺织高校基础科学学报;2010年03期
9 廖娟芬;黄绍军;李春红;;具有部分缺失数据的异均值方差分析法[J];海南师范大学学报(自然科学版);2011年01期
10 李乃医;李永明;;缺失数据下带有讨厌参数的经验似然比置信区域[J];统计与决策;2011年08期
11 金勇进;缺失数据的插补调整[J];数理统计与管理;2001年06期
12 朱五英;;具有部分缺失数据两个几何分布总体的估计[J];安徽师范大学学报(自然科学版);2008年01期
13 张香云;;Gibbs抽样在不同缺失率下的参数估计[J];统计与决策;2008年04期
14 张香云;张秀伟;;不同缺失率下EM算法的参数估计[J];数理统计与管理;2008年03期
15 赵志文;刘银萍;;具有部分缺失数据的两个幂分布总体参数的估计与检验[J];吉林师范大学学报(自然科学版);2008年03期
16 邹凤;韦程东;;缺失数据下非参数模型均值估计的两个结果[J];广西师范学院学报(自然科学版);2009年02期
17 陈菲;刘玉春;;具有部分缺失数据时两个Weibull总体的估计和检验[J];吉林师范大学学报(自然科学版);2010年01期
18 赵志文;付志慧;;具有部分缺失数据的两个瑞利分布总体参数的估计与检验[J];北华大学学报(自然科学版);2008年03期
19 赵志文;王思洋;王瑞庭;李玲;;定时截尾下具有部分缺失数据两个指数总体参数的估计与检验[J];吉林大学学报(理学版);2009年01期
20 赵志文;宋立新;刘银萍;;具有部分缺失数据的两个几何分布总体参数的估计与检验[J];统计与决策;2010年05期
中国重要会议论文全文数据库 前10条
1 管河山;姜青山;Steven X.Wei;;一种处理缺失数据的新方法[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
2 耿直;葛丹丹;;纵向研究非随机缺失数据分析[A];中国现场统计研究会第12届学术年会论文集[C];2005年
3 张香云;;基于EM算法缺失数据下混合模型的参数估计[A];第十三届中国管理科学学术年会论文集[C];2011年
4 曾莉;张淑梅;辛涛;;IRT模型中缺失数据处理方法比较[A];第十一届全国心理学学术会议论文摘要集[C];2007年
5 雷蕾;吴乃君;刘鹏;刘兰娟;;灵敏度分析:分类器中的缺失数据[A];第11届海峡两岸信息管理发展策略研讨会论文集[C];2005年
6 廖学清;吕强;;试析数据缺失下学习贝叶斯网中初始网络的选择[A];2008'中国信息技术与应用学术论坛论文集(二)[C];2008年
7 孙玲;刘浩;袁长亮;;北京市城市快速路微波检测缺失数据分析[A];2008第四届中国智能交通年会论文集[C];2008年
8 孙玺菁;司守奎;刘超;;支持向量机在缺失数据样本分类上的应用[A];第25届中国控制会议论文集(中册)[C];2006年
9 肖进;贺昌政;;面向缺失数据的客户价值区分集成模型研究[A];中国企业运筹学[2010(1)][C];2010年
10 管河山;姜青山;谭忠;;一种处理缺失数据的回归模型[A];第二十二届中国数据库学术会议论文集(技术报告篇)[C];2005年
中国博士学位论文全文数据库 前10条
1 贾博婷;缺失数据下一类整值时间序列的统计推断[D];吉林大学;2014年
2 祝丽萍;几种缺失数据和高维数据模型的统计分析[D];山东大学;2012年
3 王睿;胃食管反流病流行病学调查及其缺失数据的处理方法研究[D];第二军医大学;2009年
4 赵慧秀;可交换的两值数据的统计分析[D];东北师范大学;2009年
5 郑术蓉;线性不等式约束下的EM算法[D];吉林大学;2004年
6 阎小妍;基于胃肠疾病流行病学调查数据的结构方程建模研究[D];第二军医大学;2009年
7 程皖民;基于小子样复杂信息集的可靠性评估方法及其应用研究[D];国防科学技术大学;2006年
8 Abdalroof M.Shaip;基于删失数据的统计推断[D];吉林大学;2013年
9 王秀丽;半参EV模型和缺失数据下估计方程的经验似然推断[D];山东大学;2011年
10 杨磊;贝叶斯非参数统计中的先验的估计[D];华东师范大学;2014年
中国硕士学位论文全文数据库 前10条
1 田霆;定时截尾缺失数据下指数分布的统计推断[D];华中科技大学;2004年
2 贾博婷;具有缺失数据的整值自回归模型的统计推断[D];吉林大学;2011年
3 赵丽;缺失数据模型的逆概率加权的双重稳健估计[D];山东大学;2010年
4 齐化富;缺失数据下两类回归模型的经验似然推断[D];广西师范大学;2006年
5 李长军;基于贝叶斯网络的中医医案数据挖掘[D];厦门大学;2008年
6 李佳宁;有缺失数据的双向有序方列联表的统计推断[D];东北师范大学;2005年
7 石红亮;含缺失数据线性模型中的变量选取[D];东北师范大学;2008年
8 刘锴明;代价敏感的缺失值填充若干问题研究[D];广西师范大学;2010年
9 谢易林;随机缺失下自适应变系数模型的相关估计与性质[D];湖南师范大学;2010年
10 董冬;缺失数据下线性模型回归系数岭估计的大样本性质[D];广西师范大学;2010年
中国重要报纸全文数据库 前10条
1 刘若帆宋林;诗邦金A6+1:凭借其质提高其量[N];农资导报;2008年
2 姜明;天津:万名职工评工会[N];工人日报;2005年
3 记者 刘苏华特约记者 宋林;金沂蒙生态肥业召开2008经销商年会[N];农资导报;2008年
4 崔昕;带着经验前行[N];中国医药报;2005年
5 刘苏华宋林;树品牌 拓市场 求实效[N];中华合作时报;2008年
6 合水县人行 王风霞;基层金融统计数据集中工作中存在的问题及建议[N];陇东报;2007年
7 王振权;抽样调查数据的质量控制[N];中国信息报;2009年
8 记者 靳晓磊;2月份扬尘污染综合整治考核公示[N];石家庄日报;2009年
9 北京大学教育学院 马莉萍 丁小浩;就业因素中的社会关系[N];中国教育报;2010年
10 陈曦 堂庆;日均审核退税超千万[N];扬州日报;2011年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978