收藏本站
收藏 | 论文排版

带置信度分类器的研究与应用

王华珍  
【摘要】: 高风险领域的分类问题对模式分类算法提出以下三个挑战: 1)能否设计一种分类器模型,使得它的输出结果能够附带置信度; 2)预测输出的置信度是有效的,应该使得算法的准确率能够被置信度所控制。 3)算法应能够独立地对每个测试数据提供相应的置信度评估,也就是说,能够根据指定的置信度产生相应的预测结果。 针对上述三个挑战,我们引入了基于转导推理和随机性检验的置信预测方法来解决这些问题。近年新发展起来的一致性预测器(CP)是这种方法的典型代表。但是,CP在实践中的实用性较差,主要是其固有的运算效率低下、以及对样本奇异函数的设计缺乏指导性准则。我们的工作主要是改进了CP的理论模型,提出了混合压缩一致性预测器(HCCP)的算法框架及其实现技术,使其更适合于实际应用。 HCCP在预测性能与计算效率间取得了一个较好的折衷,它在处理大数据集学习问题时,在保持算法的预测效率的同时大大提高了CP的运算效率。HCCP的运作特点是将用于学习的样本序列划分成两个部分,并采用两阶段混合压缩:第一阶段先将前一部分序列样本压缩成一个模型,并以知识的形式保存;第二阶段再将上述知识传递给后续的检验样本序列用于置信预测。在算法实现技术方面,HCCP采用有监督的度量学习方法来实现有效信息在两个子序列(训练样本序列和检验样本序列)中的传递。并分别通过有监督核学习方法(HCCP-KerNN)和随机森林技术(HCCP-RF)实现了度量学习和样本奇异函数的设计。我们还从实验角度展现了HCCP-RF算法在田纳西-伊斯曼化工过程(TEP)这样的流程工业大系统的在线故障置信检测中的适用性和有效性。 针对小数据集的学习问题,我们也提出了一种无划分的HCCP-RF算法,它取消了对学习样本集的划分,更加适用于处理小样本数据。通过对慢性胃炎中医诊断数据集的实验,验证了该算法的有效性。 最后,对本文的工作进行了总结,并对今后的研究工作提出了展望。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 傅惠民;陈建伟;;仿真结果距离检验方法和频谱分析方法对比分析[J];机械强度;2010年01期
2 丁志中,易茂祥;自相关函数估值的快速算法[J];安徽师范大学学报(自然科学版);1996年04期
3 刘渝;在有色高斯噪声中离散时间检测和估计的性能分析[J];电子与信息学报;1987年02期
4 朱明旱;罗大庸;易励群;;一种序列的加权kNN分类方法[J];电子学报;2009年11期
5 范懋本;纪飚;;噪声中已知信号的有限样本Robust检测[J];南京邮电大学学报(自然科学版);1987年01期
6 郑拯国;陈光梦;;一种用于软件无线电中的有效的采样率转换算法[J];微型电脑应用;2007年11期
7 韩小云,周建平,刘瑞岩;广义聚类神经网络GC[J];数据采集与处理;1999年01期
8 王建新;黄元南;陈建二;;一种基于彩色编码技术的基序发现算法[J];软件学报;2007年06期
9 胡兆勇,屈梁生;贝叶斯网络推理的一种仿真算法[J];系统仿真学报;2004年02期
10 陈建;谭献海;贾真;;7种Hurst系数估计算法的性能分析[J];计算机应用;2006年04期
11 王建新;杨德;陈建二;;基于统一投影和邻居桶聚集提炼策略的基序查找算法[J];小型微型计算机系统;2007年11期
12 王华珍;林成德;杨帆;庄进发;;带置信度的混合压缩相符预测器模型研究[J];华中科技大学学报(自然科学版);2009年01期
13 丁睿;高西奇;尤肖虎;;MIMO系统的改进序贯蒙特卡罗迭代检测算法[J];电子与信息学报;2010年02期
14 穆常青;潘明海;刘峰;;外推算法在实时杂波模拟中的应用[J];无线电工程;2006年06期
15 田新广;孙春来;段洣毅;钱小军;邱志明;;基于机器学习的用户行为异常检测模型[J];计算机工程与应用;2006年19期
16 魏利胜;费敏锐;张波;;一种基于数据融合的新型GM(1,1)建模研究[J];系统仿真学报;2006年S2期
17 孙翔;邢勇志;;EXCEL在水文频率分析中的应用[J];江淮水利科技;2006年06期
18 刘丁慧;林和平;姜春燕;曹志胜;;灰聚类分析及其应用研究[J];吉林大学学报(信息科学版);2007年04期
19 王振岭;余凡;;利用FFT实现长码的直接捕获[J];无线电工程;2008年06期
20 王立宏;赵宪佳;武栓虎;;基于EM的启动子序列半监督学习[J];计算机研究与发展;2009年11期
中国重要会议论文全文数据库 前10条
1 魏利胜;费敏锐;张波;;一种基于数据融合的新型GM(1,1)建模研究[A];中国系统仿真学会第五次全国会员代表大会暨2006年全国学术年会论文集[C];2006年
2 郭炳庆;孙元章;黎雄;;加权α-截尾均值滤波器的自适应系数选择[A];2001中国控制与决策学术年会论文集[C];2001年
3 黄衍波;;两种实现采样速率变换方案[A];江苏省通信学会2004年学术年会论文集[C];2004年
4 傅惠;徐建闽;梁俊斌;林培群;;基于动态时间弯曲的多模板匹配车型分类[A];可持续发展的中国交通——2005全国博士生学术论坛(交通运输工程学科)论文集(下册)[C];2005年
5 张力健;杨继平;张秋菊;;AR-GARCH型残差控制图及其应用研究[A];第八届中国管理科学学术年会论文集[C];2006年
6 吉培荣;洪磊一;王平;;GM(1,1)模型的加数建模法[A];管理科学与系统科学进展——全国青年管理科学与系统科学论文集(第4卷)[C];1997年
7 徐志强;刘明光;;铁路信号电源故障信息识别新方法[A];可持续发展的中国交通——2005全国博士生学术论坛(交通运输工程学科)论文集(下册)[C];2005年
8 李军;朱启镕;俞蕙;顾新焕;;上海地区儿童急性下呼吸道感染的鼻病毒检测及临床研究[A];2006(第三届)江浙沪儿科学术会议暨浙江省儿科学术年会论文汇编[C];2006年
9 李军;朱启镕;俞蕙;顾新焕;;上海地区儿童急性下呼吸道感染的鼻病毒检测及临床研究[A];中华医学会第十四次全国儿科学术会议论文汇编[C];2006年
10 张利;李星毅;施化吉;;一种基于ARIMA模型的短时交通流量改进预测算法[A];2007第三届中国智能交通年会论文集[C];2007年
中国博士学位论文全文数据库 前3条
1 王华珍;带置信度分类器的研究与应用[D];厦门大学;2009年
2 李军;上海地区急性下呼吸道感染患儿鼻病毒检测及临床研究[D];复旦大学;2006年
3 马赓宇;基于HMM的时间序列聚类与识别[D];清华大学;2004年
中国硕士学位论文全文数据库 前10条
1 张利;基于时间序列ARIMA模型的分析预测算法研究及系统实现[D];江苏大学;2008年
2 张蓉芳;急性呼吸道感染患儿人副流感3型的检测及临床研究[D];兰州大学;2007年
3 伍永森;两相流测量信号的时间序列分析[D];中国石油大学;2007年
4 粟勤农;煤炭价格的时间序列模型分析与设计研究[D];武汉科技大学;2006年
5 孙桂萍;NA样本序列在统计推断研究中的若干结果[D];吉林大学;2007年
6 石翠萍;三维步态识别[D];扬州大学;2007年
7 杜秋超;基于可信最邻近分类器的文本分类的研究[D];北京交通大学;2008年
8 杨蕾;空巢老人智能监护系统中异常检测问题的研究[D];中南大学;2009年
9 牛爽;基于浮动车的城市道路交通异常事件检测的研究[D];北京交通大学;2008年
10 刘丁慧;灰聚类在城市竞争力评估中的应用与研究[D];东北师范大学;2007年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978