收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于信息理论的特征选择算法研究

陆景辉  
【摘要】: 图像处理、信息检索以及生物信息学等大规模机器学习问题的不断涌现,对已有的特征选择算法和机器学习算法提出了严峻的挑战,迫切需要适应大规模数据集的准确性和运行效率等综合性能较好的特征选择算法以及机器学习算法。本文在高维数据的特征选择以及无监督的动态特征选择方面开展了研究。 本文首先介绍了信息理论和特征选择的基础知识,并且介绍了几个典型的特征选择方法,其中ReliefF算法被公认为一种简单高效的Filter类型的特征选择算法。 针对ReliefF算法的不足,利用信息论中的散度对其进行了改进,在相同的时间复杂度下,使得结果的有效性得到了一定的改善。为了弥补Individual Evaluation结果的有效性较差和Subset Evaluation的效率较低的缺点,提出了两步法的特征选择框架,并且实现了去除冗余特征的算法,在保证结果有效性的前提下相对于Subset Evaluation大大降低了时间复杂度。 对无监督的特征选择算法进行了尝试性的研究,在增加无标签样本的情况下实现了对特征集合的自动修正,验证了这种实验方法的可行性。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 徐峻岭;徐宝文;张卫丰;崔自峰;;一种启发式聚类特征选择方法(英文)[J];东南大学学报(英文版);2006年02期
2 张莉,孙钢,郭军;基于K-均值聚类的无监督的特征选择方法[J];计算机应用研究;2005年03期
3 童舜海;;基于信息论的图像特征选择[J];丽水学院学报;2011年05期
4 王卫玲;初建崇;许立科;;一种基于关联性的特征选择算法[J];计算机应用与软件;2009年08期
5 黄峰;谭金波;杨晓江;李艺;;网络教育资源的特征选择研究[J];教育与职业;2008年12期
6 周宇;覃征;;聚类分析中特征选择的研究[J];计算机应用研究;2006年05期
7 钟鸣;陈文伟;;示例学习的抽象信道模型及其应用[J];计算机研究与发展;1992年01期
8 王秀英;邵志清;刘红丽;;一种杂交特征选择算法及其应用[J];计算机工程;2008年11期
9 唐亮;段建国;许洪波;梁玲;;基于互信息最大化的特征选择算法及应用[J];计算机工程与应用;2008年13期
10 汪正中;张洪渊;;基于英文博客文本的情感分析研究[J];计算机技术与发展;2011年08期
11 李杨寰;高峰;李腾;周智敏;;特征选择中信息熵的应用[J];计算机工程与应用;2009年15期
12 方玉萍;吴惠;杨立坤;罗敬;邱辉;侯昌东;;遗传算法与文本特征选择方法相结合的研究[J];电脑知识与技术;2009年13期
13 陈伏虎,宫先仪;遗传与互信息混合算法用于水声目标特征选择[J];信号处理;1997年03期
14 刘斌,曾立波,刘生浩;血液细胞图像自动识别系统的研究[J];计算机工程;2003年01期
15 任江涛;孙婧昊;黄焕宇;印鉴;;一种基于信息增益及遗传算法的特征选择算法[J];计算机科学;2006年10期
16 张惠春;;基于最大熵模型的中文名词短语识别[J];电脑知识与技术;2009年08期
17 王卫玲;孔波;初建崇;杨玫;;一种新的用于文本分类的特征选择算法[J];信息技术与信息化;2009年06期
18 孙雷,王新;一种基于遗传操作和类内类间距离判据理论的特征选择方法[J];计算机工程与应用;2004年21期
19 张向荣,焦李成;基于免疫克隆选择算法的特征选择[J];复旦学报(自然科学版);2004年05期
20 闫相国,明利强;分支定界算法在白细胞特征选择中的应用研究[J];天津职业技术师范学院学报;2004年03期
中国重要会议论文全文数据库 前10条
1 徐燕;王斌;李锦涛;孙春明;;知识增益:文本分类中一种新的特征选择方法[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
2 李娜;曾向阳;;目标识别中的样本选择和特征选择联合算法研究[A];2009年西安-上海声学学术会议论文集[C];2009年
3 张莉;孙钢;郭军;;基于无监督学习的特征选择方法[A];2004中国控制与决策学术年会论文集[C];2004年
4 曹艳梅;;从Shannon & Moles的交际理论看语言交际中的冗余性[A];第六届中国跨文化交际研究会年会论文摘要汇编[C];2005年
5 徐孔庆;;从信息论谈提高课堂教学效率[A];基于信息技术的教学新模式研究[C];2006年
6 陈伟;;从信息论角度对FDMA、TDMA和CDMA之比较研究[A];大连海事大学校庆暨中国高等航海教育90周年论文集(船舶通信与导航分册)[C];1999年
7 张永;陈思睿;杨志勇;;一种改进的文本分类方法的研究[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年
8 ;前言[A];中国电子学会第十六届信息论学术年会论文集[C];2009年
9 王强;曾向阳;王曙光;李娜;;主元分析在水下目标特征选择中的应用[A];中国声学学会水声学分会2011年全国水声学学术会议论文集[C];2011年
10 ;中国电子学会第十七届信息论学术年会征文通知[A];2009年研究生学术交流会通信与信息技术论文集[C];2009年
中国博士学位论文全文数据库 前10条
1 韦娜;基于内容图像检索关键技术研究[D];西北大学;2006年
2 张颖;基于群集智能模式识别方法的研究[D];大连理工大学;2008年
3 吕铁军;通信信号调制识别研究[D];电子科技大学;2000年
4 燕忠;基于蚁群优化算法的若干问题的研究[D];东南大学;2005年
5 陈晓云;文本挖掘若干关键技术研究[D];复旦大学;2005年
6 李勇明;尿沉渣图像自动识别算法的研究[D];重庆大学;2007年
7 刘天羽;基于特征选择技术的集成学习方法及其应用研究[D];上海大学;2007年
8 杨水山;冷轧带钢表面缺陷机器视觉自动检测技术研究[D];哈尔滨工业大学;2009年
9 沙朝锋;基于信息论的数据挖掘算法[D];复旦大学;2008年
10 黄东山;特征选择及半监督分类方法研究[D];华中科技大学;2011年
中国硕士学位论文全文数据库 前10条
1 陆景辉;基于信息理论的特征选择算法研究[D];北京交通大学;2007年
2 张隆;基于信息论的特征选择和分类算法研究[D];西南农业大学;2005年
3 杨打生;特征选择的信息论算法研究[D];东南大学;2005年
4 房一鸣;用分类树算法进行上市公司评级的实证研究[D];对外经济贸易大学;2006年
5 刘何秀;神经网络集成算法的研究[D];中国海洋大学;2009年
6 侯小静;贝叶斯分类器研究及其在Web文档分类中的应用[D];郑州大学;2005年
7 秦永;遥感影像特征提取与选择及在影像分类中的应用[D];辽宁工程技术大学;2005年
8 刘宜萍;基于特征选择的多因素时间序列预测模型研究[D];合肥工业大学;2006年
9 庞宵;信息熵蚁群算法在特征提取和图像识别中的应用[D];辽宁科技大学;2008年
10 王玉晶;基于禁忌搜索算法的生理信号情感识别研究[D];西南大学;2008年
中国重要报纸全文数据库 前10条
1 毕东海;信息论的深远影响[N];浙江日报;2000年
2 王春梅;充分调动社会打假资源[N];中国医药报;2004年
3 周晓娟;TD已过分水岭[N];通信产业报;2008年
4 陈力丹;当以信息论新闻[N];湖南日报;2002年
5 亦实;广义信息论方法[N];中国纪检监察报;2005年
6 杨贝;走近信息论之父——香农博士[N];光明日报;2001年
7 ;追忆信息论之父-香农博士[N];科技日报;2001年
8 记者 郭逸晴 通讯员 段荣;零售业零散度高达90%[N];南方日报;2006年
9 贝尔实验室 中国基础研究院供稿;信息论之父香农博士去世[N];华夏时报;2001年
10 高德 高德哲学与医学网 □ 付兰英 包头市第四医院;探讨中医“气”的哲学实质[N];中国中医药报;2006年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978