收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

复杂音频分类中的关键问题研究

王荣燕  
【摘要】:音频信息,是人类所能感知的一种重要信息形态。近年来,随着网络上音视频多媒体信息的迅猛增加,如何将海量的音视频文件按照语义描述进行管理和查找已经成为迫切需要解决的问题。音频分类,作为其中最关键的问题,已经逐渐成为理论研究和实际应用的一个新热点。本论文围绕复杂环境下音频流分类问题,对复杂环境下样本选择、多类别音频特征选取以及复杂环境下的半监督学习等展开研究,具体研究工作和创新点包括: 1)提出基于聚类的待标记训练样本选择算法。 基于样本的学习方法是设计分类器最有效的方法,因而训练样本的数量和质量自然成为影响分类器性能最关键的因素之一。本文针对复杂音频环境下标注工作量大并且标注困难的问题,提出从未标记音频片段中选择对分类更有效的样本进行人工标注的思想,在无监督信息的条件下,通过聚类挖掘音频流中的有用音频片段并对其进行标注。从而达到在同等标注工作量的条件下,提高分类器精度的目的。 2)提出一种GDM (Gaussian Mixture Model based Discrimination Maximization)过滤式特征选择算法。 音频特征,是影响音频分类器性能的另一关键因素。对于有限的训练样本,我们希望用尽可能少的特征实现具有良好泛化能力的分类器。 传统过滤式特征选择算法是基于单高斯分布假设的,对于复杂环境下的音频分类问题,很多音频类型对应的样本分布比较复杂,无法用简单的高斯分布进行描述;同时,不同音频类别间的区分性特征会有所差异,选择使所有类别间平均分类准确率最大的特征是一种自然的策略,但这种策略常常会受易分类别较大的影响。而实际上,提高容易混淆类别间的分类精度是问题的关键。因此,本文提出一种GDM过滤式特征选择算法,提出用不同类别GMM(Gaussian Mixture Model)间的距离作为类别间分离度度量,选择对易混淆类别具有最好区分性的特征。 3)提出一种基于高斯混合分量聚类的Fisher得分空间分类算法。 影响分类器性能的因素除了训练样本和特征外还有分类模型。目前,统计模型学习算法分为生成式模型(如GMM)和区分式模型(如SVM, Support Vector Machine)。 在有限的训练样本情况下,本文采用SVM作为最终分类器。针对SVM需求等长度特征矢量的要求,采用基于GMM描述样本分布细节的Fisher得分空间变换函数,将不等长的音频片段特征变成等长的Fisher空间的特征。并针对合并各类GMM时所产生的特征维数过高问题,提出基于高斯混合分量聚类的Fisher得分空间分类算法。 4)提出一种基于置信度和聚类的未标记样本选择算法用于半监督学习。 针对复杂环境下音频标注工作困难这一问题,将半监督学习算法引入到音频分类问题中。在应用TSVM(Transductive SVM)分类器时,发现其分类性能并不是随着未标记样本的增多不断提高,这说明在有限的己标记样本情况下,不是任意的未标记样本对半监督学习都能有所帮助,针对这一特殊问题,本文提出一种基于置信度和聚类的未标记样本选择算法。实验结果表明,通过该算法选出的未标记样本用于半监督学习时比将所有样本用于半监督学习时平均分类准确提高显著。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 宁朝;基于SVM技术的英文字符识别方法[J];大众科技;2005年08期
2 王清翔;仲婷;潘金贵;;基于SVM的日文网页分类[J];广西师范大学学报(自然科学版);2007年02期
3 赵书河,冯学智,都金康,林广发;基于支持向量机的SPIN-2影像与SPOT-4多光谱影像融合研究[J];遥感学报;2003年05期
4 张键;于忠党;栾海滢;;基于SVM的教师评价系统研究[J];教育信息化;2006年03期
5 薄丽玲;;基于SVM的数字图像水印检测算法设计[J];科技情报开发与经济;2007年33期
6 黄秀丽;王蔚;;SVM在非平衡数据集中的应用[J];计算机技术与发展;2009年06期
7 刘晓亮;丁世飞;朱红;张力文;;SVM用于文本分类的适用性[J];计算机工程与科学;2010年06期
8 任俊旭;;基于SVM的企业信息化能力成熟度测度模型研究[J];商业文化(下半月);2011年04期
9 毛伟;;基于支持向量机的回归应用研究[J];科技资讯;2011年12期
10 王双亭;艾泽天;都伟冰;康敏;;基于SVM不同核函数的多源遥感影像分类研究[J];河南理工大学学报(自然科学版);2011年03期
11 王亮申,欧宗瑛,苏铁明,杨鑫华,曾好平;利用SVM和灰度基元共生矩阵进行图像数据库检索[J];大连理工大学学报;2003年04期
12 业宁,孙瑞祥,董逸生;MLSVM4——一种多乘子协同优化的SVM快速学习算法[J];计算机研究与发展;2005年09期
13 周珂;彭宏;胡劲松;;支持向量机在心电图分类诊断中的应用[J];微计算机信息;2006年09期
14 游智;李战怀;张阳;;基于字符串核的免分词中文文本分类方法[J];计算机工程与应用;2006年26期
15 朱艳辉;王平;周咏梅;;一种基于Agent的中文Web信息自动检索系统(英文)[J];微电子学与计算机;2006年S1期
16 王明高;王琰;;基于小波提取特征的SVM目标识别[J];沈阳理工大学学报;2006年05期
17 霍东云;聂峰光;郭力;;利用Medline文摘数据库研究文本分类[J];计算机与应用化学;2007年09期
18 刘忠铁;;基于SVM的图像特征样本集构造技术研究[J];科技情报开发与经济;2007年26期
19 刘太安;杨柏翠;刘欣颖;李涵;;基于特征选择的最少核分类器研究[J];计算机工程与应用;2007年16期
20 杨克领;姜慧霖;;基于SVM的新多类分类算法[J];电脑知识与技术(学术交流);2007年13期
中国重要会议论文全文数据库 前10条
1 ;A Tool Wear Predictive Model Based on SVM[A];Proceedings of 2010 Chinese Control and Decision Conference[C];2010年
2 ;A CDMA Signal Receiver Based on LS-SVM[A];第二十六届中国控制会议论文集[C];2007年
3 司爱威;冯辅周;江鹏程;饶国强;王建;;基于可变风险SVM模型的故障识别方法研究[A];第十届全国振动理论及应用学术会议论文集(2011)上册[C];2011年
4 王红伟;董慧;;一种提高SVM分类精度的调制信号识别方法[A];2010年西南三省一市自动化与仪器仪表学术年会论文集[C];2010年
5 ;Improved Particle Swarm Optimized SVM for Short-term Traffic Flow Predication[A];第二十六届中国控制会议论文集[C];2007年
6 宋鑫颖;周志逵;;一种基于SVM的主动学习文本分类方法[A];第二十三届中国数据库学术会议论文集(技术报告篇)[C];2006年
7 邵杰;叶宁;容亦夏;;基于SVM的多波束测深数据滤波[A];第二十九届中国控制会议论文集[C];2010年
8 于湘涛;周峰;张兰;魏超;;基于SVM和田口方法的石英挠性加速度计健壮性设计[A];质量——持续发展的源动力:中国质量学术与创新论坛论文集(下)[C];2010年
9 ;Adaptive Control of Nonlinear System Based on SVM Online Algorithm[A];中国自动化学会控制理论专业委员会D卷[C];2011年
10 张睿;陈雪;马建文;;基于递归SVM的高光谱数据特征选择算法研究[A];第八届成像光谱技术与应用研讨会暨交叉学科论坛文集[C];2010年
中国博士学位论文全文数据库 前10条
1 王荣燕;复杂音频分类中的关键问题研究[D];北京邮电大学;2011年
2 渠瑜;基于SVM的高不平衡分类技术研究及其在电信业的应用[D];浙江大学;2010年
3 申丰山;样例权重估计及在此基础上的SVM[D];西安电子科技大学;2011年
4 宋国明;基于提升小波及SVM优化的模拟电路智能故障诊断方法研究[D];电子科技大学;2010年
5 张婧;基于SVM的肺结节自动识别方法研究[D];华南理工大学;2011年
6 龙艳花;基于SVM的话者确认关键技术研究[D];中国科学技术大学;2011年
7 许敏强;基于话者统计特征和SVM的文本无关话者确认研究[D];中国科学技术大学;2011年
8 王荣燕;复杂音频分类中的关键问题研究[D];北京邮电大学;2011年
9 曹志坤;制冷陈列柜性能仿真SVM方法的研究及应用[D];上海交通大学;2010年
10 王金林;基于混沌时间序列和SVM的入侵检测系统研究[D];天津大学;2010年
中国硕士学位论文全文数据库 前10条
1 严会霞;基于SVM的眼动轨迹解读思维状态的研究[D];太原理工大学;2010年
2 吴迪;基于SVM分类器的分步定位算法研究[D];哈尔滨工业大学;2010年
3 杨焕;基于Basic-N-Units特征的SVM方法预测MicroRNA[D];吉林大学;2010年
4 曾玉祥;盲抽取与SVM方法在地球化学异常下限提取中的应用[D];成都理工大学;2010年
5 曹云生;基于支持向量机(SVM)的森林生态系统健康评价及预警[D];河北农业大学;2011年
6 张汉女;基于SVM的海岸线提取方法研究[D];东北师范大学;2010年
7 姚玉;基于GA-SVM算法的细胞色素酶P450突变预测[D];上海交通大学;2011年
8 陈燃燃;基于SVM算法的web分类研究与实现[D];北京邮电大学;2010年
9 陈卓;基于聚类和SVM主动反馈的图像检索方法[D];重庆大学;2010年
10 冯青;基因微阵列数据的SVM分类器优化方法[D];东北师范大学;2010年
中国重要报纸全文数据库 前6条
1 郭涛;利用SVM虚拟化技术实现容灾[N];中国计算机报;2008年
2 本报记者 韩露;乱军之中智者胜[N];证券时报;2000年
3 ;基于网络层的存储虚拟化是主流[N];中国计算机报;2008年
4 本报记者 郭平;LSI发布新存储虚拟化管理器[N];计算机世界;2008年
5 王琨月;存储虚拟化市场的博弈[N];网络世界;2008年
6 刘;LSI Engenio 7900存储面向中端客户[N];电脑商报;2008年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978