基于支持向量机的音乐自动分类
【摘要】:音乐分类实质上是音频分类的一个分支,现已逐渐成为模式识别领域的一个研究热点,其研究发展方向大体可以归纳为以下三个方面:一是在音乐特征提取的方法和特征向量的组成上做改进;二是在分类器的选择上做改进;三是在解决多分类问题的方法上做改进。
本文采用SVM做分类器,对流行音乐、古典乐器、钢琴曲、民歌、美声、戏曲六种不同风格的音乐进行分类,实验所做的工作归纳如下:
第一,通过学习数字音频技术理论来掌握音频短时处理技术,结合实际对每个音乐样本进行预加重、分帧、加窗、判别静音帧等短时预处理,然后提取音乐样本的时、频域感知特征和基音频率特征;提取音乐样本的MFCC矩阵并求取该矩阵的统计特征。
第二,在深入理解SVM分类原理的基础上,比较标准SVM与变种SVM的优缺点,确定本实验采用标准SVM来进行分类;测试了MFCC维数、MFCC统计特征、MFCC与感知特性的各种组合方式对SVM分类器性能的影响,比较了同等条件下SVM与其它分类器的优势。
第三,研究多分类方法的应用,分析比较各种多类分类方法的优劣,提出了利用先验知识和树形结构相结合的方法构造多分类系统。用标准SVM对样本进行训练得到多个两类分类器,比较各分类器的分类精度,按照比较的结果对样本进行人为的最优聚类,再用树形非交叠结构构造多分类系统,最后测试得到较好的分类效果。