收藏本站
《南京航空航天大学》 2011年
收藏 | 手机打开
二维码
手机客户端打开本文

结构驱动的单类分类器设计及拓展研究

冯爱民  
【摘要】:分类器设计中的一个根本问题是如何提高其泛化能力,即根据从已有样本中获取的知识对未知样本进行判别的能力。因此,尽可能从样本中获取足够多的先验知识是提高泛化能力的重要途径之一。在单类分类中,由于异常样本缺失使数据信息大为减少,从而使分类器设计更为困难,因此尽力挖掘仅有的一类目标数据中的先验知识尤为重要。本文围绕着单类分类器设计,并针对数据局部密度信息、结构信息、簇信息以及少量异常数据信息等先验知识的挖掘和利用进行了较为深入的研究,所取得的主要成果如下: (1)以密度估计和支持域方法为主线综述了单类分类器的主要研究方法,并提出了一种两者结合的混合模型。从密度估计、支持域的角度重新梳理了单类分类器的主要算法,并针对作为研究热点的支持域方法,在洞察出各算法联系的基础上深入分析了超平面和超球模型的主要改进/变形模型;通过在支持域方法中嵌入局部密度,提出了适用于非对称数据分布的混合模型——局部密度嵌入的单类支持向量机线性规划算法。 (2)提出了结构驱动学习策略及相应单类模型——结构单类支持向量机(SOCSVM),并推导出对应的错分误差界。针对现有超平面单类分类器只注重局部或全局学习之不足,提出了全局与局部学习兼备的结构驱动学习策略,并以单类支持向量机为原型,通过嵌入数据结构分布信息设计出相应模型——结构单类支持向量机。作为本文后续工作的研究基础,理论证明了其最优解具有唯一性和鲁棒性,并推导出相应的错分误差界。人工和UCI数据上的实验结果表明:考虑了数据分布趋势的SOCSVM具有更强的数据描述能力,从而验证了结构驱动学习策略的有效性; (3)发展出了适用于单类多簇数据分布的结构驱动模型——结构大间隔单类分类器(SLMOCC)。基于数据分布的结构驱动学习使多簇目标数据的处理不同于单簇数据,并因此衍生出相应的分类器——结构大间隔单类分类器(SLMOCC)。通过分别约束各簇数据到最优超平面的马氏距离,SLMOCC最大程度地利用了数据的结构信息并因此具有了更精细的数据描述。为捕捉数据的多簇分布,采用了可自动确定聚类数目的凝聚型层次聚类算法。人工和UCI数据上的实验结果表明SLMOCC的性能有显著提高。 (4)构建了单类和两类问题以及数据不平衡问题的统一框架。通过在SOCSVM最小化正半空间的同时最大化正负类间隔或将结构驱动学习策略作用于ν-SVM算法并引入超平面阈值,发展出了两等价模型并统称为偏结构数据描述与判别机(BSD3M)框架,放宽了经典SVM中两类支持向量平衡的限制,并因此能够根据需要控制超平面的位置。通过合理设置目标函数及判别函数中的相应参数,BSD3M不仅可用于含极少量异常的单类问题以提高数据描述能力,同时也可推广于正负类数据大致平衡的两类问题及少量数据更为重要的数据不平衡问题。部分UCI数据集上含5%异常数据的实验结果表明:充分利用负类信息的BSD3M较之单类算法和SVM算法更为准确地描述了目标数据区域。 (5)推广出了一系列与上述各模型学习能力相当的线性规划快速算法以提高计算效率。通过最小化目标数据到超平面的函数距离,推广出SOCSVM的线性规划算法SlpOCSVM并因此使计算复杂度从二次规划的O ( n 3)提升至最快O ( n );进一步将该思想应用于多簇目标数据并以各簇数据协方差之和取代整体协方差矩阵,可将SLMOCC二次锥规划的多项式时间大幅降低;而将SlpOCSVM嵌入数据类间隔亦发展出了BSD3M的线性规划算法。上述各快速算法的实验结果验证了结构驱动学习及多簇信息嵌入同样适用于非间隔算法。
【学位授予单位】:

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 牛志恒;山世光;陈熙霖;;双向层级结构分类器及其在面部特征点定位中的应用[J];高技术通讯;2010年08期
2 曹治国;邹飞勇;张天序;;基于确定性退火技术的分类器设计[J];计算机工程与应用;2006年03期
3 孙红兵;杜辉;莫永新;;车辆类型自动分类器的研究[J];农业装备与车辆工程;2007年09期
4 赵春晖;张洪才;陆朝霞;;基于Adaboost的选择性样本权重更新算法[J];计算机应用研究;2008年10期
5 李茂宽;关键;;基于共形几何代数与二次规划的分类器设计[J];光电工程;2010年07期
6 周立业;秦国军;胡茑庆;;人工嗅觉支持向量分类器及其应用[J];中国科技信息;2008年18期
7 安艳辉;陈韶霞;刘宗敏;;基于字符类别的识别反馈混排字符切分方法[J];河北省科学院学报;2011年01期
8 李睿;李伟娟;李明;;基于加权量子粒子群的分类器设计[J];计算机工程;2010年07期
9 吴德天;杨根兴;;嵌入式平台下英文名片字符识别算法的实现[J];北京机械工业学院学报;2008年04期
10 赵继印;郑蕊蕊;吴宝春;李敏;;脱机手写体汉字识别综述[J];电子学报;2010年02期
11 王成;刘亚峰;王新成;闫桂荣;;分类器的分类性能评价指标[J];电子设计工程;2011年08期
12 熊范纶;;分层分类器设计及实验结果[J];自动化学报;1986年03期
13 伍振军,丁晓青;鲁棒的多体印刷英文识别系统的实现[J];计算机工程与应用;2001年20期
14 陈志杰;冯德军;王雪松;;基于ROC曲线的弹道目标识别评估及优化[J];系统仿真学报;2007年17期
15 王德鹏;李凡长;;Agent普适机器学习分类器[J];南京大学学报(自然科学版);2008年02期
16 王琦;汪增福;;基于分段线性化的分类器设计方法[J];模式识别与人工智能;2009年02期
17 杜梅;赵怀慈;;手写数字识别的研究[J];计算机工程与设计;2010年15期
18 李超;熊璋;贺静;薛玲;;基于Web Service的多层音频分类器设计[J];计算机工程与设计;2006年04期
19 冯涛;;基于人工神经网络的通信信号分类识别[J];无线电工程;2006年06期
20 魏娜;朱参世;;基于多粒度免疫聚类的分类器设计[J];计算机工程与应用;2007年19期
中国重要会议论文全文数据库 前10条
1 宋雅男;谢凌云;;易混淆韵母中(a,ua),(an,uan)的分类器设计[A];中国声学学会2007年青年学术会议论文集(下)[C];2007年
2 瞿寿德;孙铁;倪涛;邱道尹;;模式识别应用于在线推断烧结矿质量[A];1992年中国控制与决策学术年会论文集[C];1992年
3 李茂宽;关键;;基于共形几何代数与最小二乘的分类器设计[A];2010振动与噪声测试峰会论文集[C];2010年
4 李方涛;张显;孙建树;朱小燕;;一种新的层次化结构问题分类器[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
5 郭薇;耿伯英;;Floatboost算法在多视角目标识别中的应用研究[A];中国电子学会第十五届信息论学术年会暨第一届全国网络编码学术年会论文集(上册)[C];2008年
6 郭薇;耿伯英;;基于Floatboost的多角度目标识别[A];全国第19届计算机技术与应用(CACIS)学术会议论文集(下册)[C];2008年
7 李训青;黄磊;刘迎建;;基于Boosting集成的SMO增强型分类器设计[A];第八届全国汉字识别学术会议论文集[C];2002年
8 刘皓挺;姜国华;王丽;;一种BPNN分类器的设计及应用[A];人-机-环境系统工程研究进展(第七卷)[C];2005年
9 吴刚;德熙嘉措;黄鹤鸣;;印刷体藏文识别技术[A];第十届全国少数民族语言文字信息处理学术研讨会论文集[C];2005年
10 陈亚菲;张宝昌;;基于L2-norm最小化的人体检测[A];第八届全国信息获取与处理学术会议论文集[C];2010年
中国博士学位论文全文数据库 前10条
1 吕铁军;通信信号调制识别研究[D];电子科技大学;2000年
2 陆明泉;多信号的调制识别技术研究[D];电子科技大学;2008年
3 刘华林;高分辨距离像雷达自动目标识别研究[D];电子科技大学;2008年
4 周晓飞;几种新型分类器设计及其在人脸识别应用中的研究[D];南京理工大学;2008年
5 张葛祥;雷达辐射源信号智能识别方法研究[D];西南交通大学;2005年
6 丁宇航;手背静脉识别技术研究[D];哈尔滨工程大学;2006年
7 杨端端;手写虚拟汉字识别研究及其在多通道短信交互系统中的应用[D];华南理工大学;2007年
8 何英华;模式分类与视觉导航中的分层数据处理研究[D];清华大学;2005年
9 徐中宇;虹膜识别算法的研究[D];吉林大学;2006年
10 胡静;机器学习及其神经网络分类器优化设计[D];合肥工业大学;2007年
中国硕士学位论文全文数据库 前10条
1 李超洋;智能人脸识别技术研究[D];西安电子科技大学;2004年
2 曹菁菁;基于AFS理论的遗传算法研究与应用[D];大连海事大学;2008年
3 朱小蕾;基于AFS模糊逻辑和属性选择的分类问题研究[D];大连海事大学;2009年
4 冯兴华;基于AFS理论的模糊决策树算法研究[D];大连海事大学;2008年
5 贾可新;通信信号自动调制识别的研究[D];电子科技大学;2007年
6 严涛;基于点集Voronoi图的分类器设计[D];河北师范大学;2007年
7 覃伟荣;基于粗糙集理论的空间数据挖掘研究[D];广西大学;2008年
8 冉丹;基于核方法和流形学习的雷达目标识别[D];电子科技大学;2008年
9 万忠;轨道衡车牌识别系统[D];安徽大学;2006年
10 陈立君;基于多分辨率分形维的木材表面纹理分类的研究[D];东北林业大学;2007年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978