收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于最小联合互信息亏损的最优特征选择算法研究

张逸石  
【摘要】:随着社会经济与计算机技术的快速发展,研究一种能够有效地提高分类学习算法性能和效率的Filter型特征选择算法有着重要的理论价值与广泛的应用前景。 提出了一种基于最小联合互信息亏损的最优特征选择算法。该算法将以联合互信息作为评价准则的特征选择问题分解为两个子问题,采用最大条件互信息原则进行搜索直到获得一个无差异特征子集,并采用一种最小联合互信息亏损原则对所得无差异特征子集进行冗余特征的判断与删减。从条件互信息估计可靠性的角度上来看,最小联合互信息亏损原则减小了因样本不足而引起的条件互信息估计的偏差。从而能够获得一个较好地表达原始数据集且规模较小的特征子集。 为解决特征子集规模较大时条件互信息估计所面临的维数瓶颈问题,提出了一种快速条件互信息估计方法,并将其用于所提算法的实现。首先引入局部互信息的概念,并揭示了局部互信息与条件互信息之间的关系,进而通过对局部互信息的逐一求解来实现对条件互信息的估计。 选择了10种常用的基准数据集与挑战性数据集对所提算法和快速条件互信息估计方法进行了详细的性能实验。所选数据集训练样本跨度为2000~72626,特征维数跨度为22~139351,有利于全面检验算法的性能。实验结果表明了所提算法的优越性。同时,实验结果还表明了所提快速条件互信息估计方法的有效性,特别是对于含有139351个特征的Thrombin数据集而言,所提快速估计方法无论是在运行时间还是在存储空间上都有显著的优势。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 洪智勇;王天擎;刘灿涛;;一种新的互信息特征子集评价函数[J];计算机工程与应用;2011年22期
2 李正;倪远平;刘迪;王海鹏;;实蝇图像识别中的形态特征提取研究[J];计算机仿真;2011年07期
3 陶慧;祁佩棉;;基于遗传算法的煤与瓦斯突出影响因素研究[J];河南理工大学学报(自然科学版);2011年03期
4 李正;倪远平;刘迪;王海鹏;;实蝇图像识别中的形态特征提取研究[J];机械与电子;2010年S1期
5 靳旭玲;余桂贤;徐亚飞;李光平;薛阳;;基于免疫算法和反向传播神经元网络的无线网络入侵检测研究[J];计算机应用与软件;2011年08期
6 吴萍;姜懿庭;;基于粗糙集和信息熵的入侵检测特征选择方法研究[J];云南民族大学学报(自然科学版);2011年04期
7 吴克寿;陈玉明;谢荣生;王晓栋;;基于粗糙集与蚁群优化算法的特征选择方法研究[J];计算机应用研究;2011年07期
8 冯霞;刘志辉;田继存;;基于假设检验的文本分类特征选择[J];信息与控制;2011年03期
9 张国梁;肖超锋;;基于SVM新闻文本分类的研究[J];电子技术;2011年08期
10 郑娅峰;张巧荣;肖会敏;;自动特征选择和加权的图像显著区域检测[J];计算机工程与应用;2011年24期
11 贾娴;刘培玉;公伟;;应用于入侵取证的改进信息增益算法[J];计算机应用;2011年08期
12 邓河;严志;;一种基于Filter与Wrapper模型的网络流量特征选择方法[J];长沙民政职业技术学院学报;2011年02期
13 葛敏敏;范丽亚;;基于支持向量机的特征选择[J];聊城大学学报(自然科学版);2011年02期
14 王桂娟;印鉴;詹卫许;;基于类别信息的特征子图选择策略[J];计算机科学;2011年08期
15 杨经;林世平;;基于SVM的文本词句情感分析[J];计算机应用与软件;2011年09期
16 奉国和;郑伟;;文本分类特征降维研究综述[J];图书情报工作;2011年09期
17 孟佳娜;林鸿飞;李彦鹏;;基于特征贡献度的特征选择方法在文本分类中应用[J];大连理工大学学报;2011年04期
18 计智伟;胡珉;;一种双重过滤式特征选择算法[J];计算机工程与应用;2011年19期
19 方志龙;;文本特征选择算法MI的改进[J];计算机与现代化;2011年07期
20 姜慧研;柴天佑;;基于可信间隔的特征选择方法研究[J];控制与决策;2011年08期
中国重要会议论文全文数据库 前10条
1 李娜;曾向阳;;目标识别中的样本选择和特征选择联合算法研究[A];2009年西安-上海声学学术会议论文集[C];2009年
2 张永;陈思睿;杨志勇;;一种改进的文本分类方法的研究[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年
3 王强;曾向阳;王曙光;李娜;;主元分析在水下目标特征选择中的应用[A];中国声学学会水声学分会2011年全国水声学学术会议论文集[C];2011年
4 高砚军;徐华平;;基于窗口自适应灰度共生矩阵的SAR图像分类[A];第六届全国信息获取与处理学术会议论文集(1)[C];2008年
5 李晓丽;王彤;杜振龙;;基于粗糙集理论的流数据最优特征选择[A];第二十二届中国数据库学术会议论文集(研究报告篇)[C];2005年
6 徐燕;孙春明;王斌;李锦涛;;基于词条频率的特征选择算法研究[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
7 李爱新;孙铁;郭炎峰;;基于人工神经网络的脑电信号模式分类[A];自动化技术与冶金流程节能减排——全国冶金自动化信息网2008年会论文集[C];2008年
8 靖红芳;王斌;杨雅辉;;基于类别分布的特征选择框架[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
9 周志红;周新聪;严新平;袁成清;;磨粒特征参数的评价与优化方法研究[A];2006全国摩擦学学术会议论文集(一)[C];2006年
10 李占潮;陈超;周喜斌;邹小勇;;基于遗传算法和支持向量机预测蛋白质结构类[A];第九届全国计算(机)化学学术会议论文摘要集[C];2007年
中国博士学位论文全文数据库 前10条
1 韦娜;基于内容图像检索关键技术研究[D];西北大学;2006年
2 张颖;基于群集智能模式识别方法的研究[D];大连理工大学;2008年
3 吕铁军;通信信号调制识别研究[D];电子科技大学;2000年
4 燕忠;基于蚁群优化算法的若干问题的研究[D];东南大学;2005年
5 陈晓云;文本挖掘若干关键技术研究[D];复旦大学;2005年
6 李勇明;尿沉渣图像自动识别算法的研究[D];重庆大学;2007年
7 刘天羽;基于特征选择技术的集成学习方法及其应用研究[D];上海大学;2007年
8 杨水山;冷轧带钢表面缺陷机器视觉自动检测技术研究[D];哈尔滨工业大学;2009年
9 黄东山;特征选择及半监督分类方法研究[D];华中科技大学;2011年
10 熊文;基于群智的特征选择、分类与聚类挖掘的研究[D];北京邮电大学;2010年
中国硕士学位论文全文数据库 前10条
1 张逸石;基于最小联合互信息亏损的最优特征选择算法研究[D];华中科技大学;2011年
2 房一鸣;用分类树算法进行上市公司评级的实证研究[D];对外经济贸易大学;2006年
3 刘何秀;神经网络集成算法的研究[D];中国海洋大学;2009年
4 张隆;基于信息论的特征选择和分类算法研究[D];西南农业大学;2005年
5 侯小静;贝叶斯分类器研究及其在Web文档分类中的应用[D];郑州大学;2005年
6 秦永;遥感影像特征提取与选择及在影像分类中的应用[D];辽宁工程技术大学;2005年
7 刘宜萍;基于特征选择的多因素时间序列预测模型研究[D];合肥工业大学;2006年
8 杨打生;特征选择的信息论算法研究[D];东南大学;2005年
9 庞宵;信息熵蚁群算法在特征提取和图像识别中的应用[D];辽宁科技大学;2008年
10 王玉晶;基于禁忌搜索算法的生理信号情感识别研究[D];西南大学;2008年
中国重要报纸全文数据库 前10条
1 周晓娟;TD已过分水岭[N];通信产业报;2008年
2 天相投顾 闻群王聃聃;选基金需考虑风险承受力[N];中国证券报;2007年
3 孙志伟;刘刚检查城防林建设[N];齐齐哈尔日报;2008年
4 郑卫东;高产鹅选种方法和标准[N];中国畜牧兽医报;2007年
5 海通证券 娄静吴先兴;把握风险收益特征选择最适合自己的基金[N];上海证券报;2007年
6 张小东;促销之十大常见误区(一)[N];黑龙江经济报;2006年
7 华泰证券 吴璟;权证投资:只买对的,不买便宜的[N];上海证券报;2008年
8 广西钦州灵山县灵城二小 纪雪林;小场地训练途中跑的方法[N];中国体育报;2008年
9 ;现代军队与智能战争[N];中国计算机报;2005年
10 张小明;如何选择供应链[N];现代物流报;2005年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978