收藏本站
《北京邮电大学》 2015年
收藏 | 手机打开
二维码
手机客户端打开本文

基于听觉场景分析的主旋律提取

李冰瑶  
【摘要】:主旋律的定义是音乐中人声的基频曲线,音乐的主旋律提取是众多研究领域,如哼唱搜索和歌曲结构分析等的基础。计算听觉场景分析(CASA)算法的目的是将人声与背景噪声分离,所以在理论上采用CASA来进行主旋律提取是一种可行的方案。但是CASA算法对混合信号的信噪比的要求比较高,目前多运用于人声和普通噪声分离。而音乐信号不满足高信噪比这一特点,并且音乐信号中的伴奏不同于普通噪声,其有明显的谐波结构,在结构上更类似于人声,会对人声的分离产生干扰,如果直接采用CASA算法进行主旋律提取而不加以改进所得到的结果并不理想。本文结合了CASA的发展现状和音乐的特点,研究了一种基于听觉场景分析的主旋律提取算法。主要工作内容如下: (1).研究了两种音乐信号预处理的方法 音乐信号中的谐波乐器信号和高次谐波信号会对基于计算听觉场景分析的主旋律提取产生一定的影响。为了解决这些问题,本文使用了两种预处理方法。第一种是运用“谐波乐器/打击乐器信号分离”(HPSS)算法对信号进行预处理。由于纯乐器信号,谐波乐器分量和打击乐器分量在语谱图上具有各向异性,利用HPSS对音乐信号进行预处理,滤除对歌声信号干扰比较大的谐波乐器分量,解决了谐波乐器信号干扰的问题。第二种是根据入声和乐器发声的特点,适当降低音乐信号的高频部分,提升音乐信号中的信噪比,解决了高次谐波影响的问题。实验证明,预处理可以显著提高主基频提取的精度。 (2).研究了一种基于计算听觉场景分析的主基频提取算法 音乐信号中真实音源数量众多,这对计算听觉场景分析是一大挑战。本文引入了多种方法来解决此问题。首先,对音乐信号进行听觉外围处理,对每一个时频单元的滤波器响应和响应包络提取相关函数和瞬时频率特征,构造6维特征向量。然后,利用提取的特征作为三个多层感知器的输入,对每一个时频单元进行基频判定,找出最有可能的基频值,作为此时频单元的基频估计值,并通过基频估计值确定相应的理想二值掩膜(IBM)。接着,通过初始估计和掩膜在每一帧内最多得到两个基频,根据短时连续性可得到多条基频曲线。本文利用迭代的方法,对基频曲线和IBM进行迭代估计,提高预测的准确度。最后,对于多基频曲线中重合的基频点,本文采用一种基频选择算法,利用了信号的短时连续性,从两个主要基频中选择一个作为主旋律。实验结果表明,本文算法对主基频提取能取得良好的效果。 (3).提出了一种基于能量比特征的基频预估计方法 人声信号和伴奏信号在高频区域的能量分布不同,人声信号在高频区域存在着明显的衰减,而伴奏信号在高频的衰减比较小。本文通过对每一帧中人声基频范围内可能的基频点分别计算该基频点的低频谐波分量和总谐波分量的能量值,计算低频谐波分量所占能量值的比例,通过能量比排序并根据判定规则滤除伪基频候选点,最终对每一时间帧得到初始基频候选值,将此基频候选值作为主旋律提取算法的基频初始估计并最终得到基频曲线。实验结果表明,与采用听觉特征进行初始预测相比,运用能量特征所得到的主基频的准确率有了很大的提高。
【学位授予单位】:北京邮电大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TN912.3

手机知网App
【参考文献】
中国期刊全文数据库 前1条
1 邱伟,黄秀轩;计算听觉场景分析介绍[J];高技术通讯;2002年01期
【共引文献】
中国期刊全文数据库 前1条
1 彭耿;黄知涛;姜文利;周一宇;;单通道盲信号分离研究进展与展望[J];中国电子科学研究院学报;2009年03期
中国硕士学位论文全文数据库 前10条
1 刘继芳;基于计算听觉场景分析的混合语音分离研究[D];哈尔滨工程大学;2009年
2 徐宏;语音盲分离算法及应用的研究[D];太原理工大学;2011年
3 郭丽惠;基于内容的哼唱式音乐检索研究[D];华东师范大学;2008年
4 王忠文;基于ARM-Linux的抗噪声语音识别技术研究[D];广东工业大学;2008年
5 职振华;语音盲分离算法的研究[D];太原理工大学;2008年
6 谢秀琴;基于时—频分析的歌声分离[D];山东大学;2009年
7 童开国;多声源环境下基于听觉中枢系统的语音分离研究[D];重庆邮电大学;2012年
8 刘维伟;面向CASA的HuWang模型算法的并行实现[D];内蒙古大学;2012年
9 吴春;基于计算听觉场景分析的双说话人混合语音分离研究[D];广西大学;2014年
10 屈俊玲;基于计算听觉场景分析的混合语音信号分离算法研究[D];太原理工大学;2014年
【二级参考文献】
中国期刊全文数据库 前2条
1 胡可;汪增福;;一种基于时频分析的语音卷积信号盲分离算法[J];电子学报;2006年07期
2 关勇;李鹏;刘文举;徐波;;基于计算听觉场景分析和语者模型信息的语音识别鲁棒前端研究[J];自动化学报;2009年04期
【相似文献】
中国期刊全文数据库 前10条
1 沈钧贤;蚱蝉Cryptotympana atrata听觉的电生理研究[J];声学学报;1989年04期
2 王立雪;王竹;;噪声对人类听觉的损伤[J];电声技术;2006年04期
3 王想实;刘培林;;计算听觉场景的算法研究[J];电脑与电信;2010年01期
4 王想实;;听觉场景分析简析[J];技术与市场;2011年06期
5 王雪;蒋大宗;;利用触觉的人工听觉发展现状[J];国外医学(生物医学工程分册);1987年06期
6 王雪君;夏秀渝;张欣;何培宇;;新的听觉注意显著图计算模型研究[J];信号处理;2013年09期
7 谢菠荪;听觉传输技术及其应用[J];电声技术;1997年12期
8 苏海鸥;;知已之耳——听觉生理与心理杂谈(一)[J];中国电子商情(视听博览);1998年12期
9 谢菠荪;;虚拟听觉环境的原理、进展和问题[J];电声技术;2008年11期
10 苏海鸥;;颂雅之声 志意得广——听觉的生理与心理杂谈之三[J];中国电子商情(视听博览);1999年03期
中国重要会议论文全文数据库 前10条
1 谢菠荪;;虚拟听觉环境的原理、进展和问题[A];2008年声频工程学术交流年会论文集[C];2008年
2 钱金宇;贾文艳;陈卉;欧阳楷;李量;;听觉定向模型研究的基础工作[A];21世纪医学工程学术研讨会论文摘要汇编[C];2001年
3 李国棋;陆宏瑶;金岩;;“听觉演示”在中国的再实践[A];中国声学学会2007年青年学术会议论文集(下)[C];2007年
4 龙长才;秦佑国;;噪声听觉增强的神经模型[A];绿色建筑与建筑物理——第九届全国建筑物理学术会议论文集(一)[C];2004年
5 高下;丁小琼;Gerald Fleischer;张倩;;高原牧区藏族学龄儿童的听觉状况与鞭炮噪声的关系[A];中华医学会第十次全国耳鼻咽喉-头颈外科学术会议论文汇编(上)[C];2007年
6 孔令志;吴玺宏;李量;;听觉原始记忆的指数消退[A];增强心理学服务社会的意识和功能——中国心理学会成立90周年纪念大会暨第十四届全国心理学学术会议论文摘要集[C];2011年
7 罗昊;倪敬田;曾凡钢;张达人;陈林;;中枢听觉系统对汉语声调的自动加工[A];中国神经科学学会第六届学术会议暨学会成立十周年庆祝大会论文摘要汇编[C];2005年
8 ;乙醇胚胎毒性致大鼠听觉系统病理变化的观察[A];中华医学会第十次全国耳鼻咽喉-头颈外科学术会议论文汇编(下)[C];2007年
9 张勉;高阳;刘景;;对52例老年人听力调查的体会[A];中华中医药学会耳鼻喉专业委员会山东中西医结合学会耳鼻喉专业委员会学术研讨会论文汇编[C];2007年
10 郭晓;刘移民;;噪声性听觉损伤遗传易感性及其研究方法进展[A];广东省环境诱变剂学会、广东省预防医学会卫生毒理专业委员会2010年学术会议资料汇编[C];2010年
中国重要报纸全文数据库 前3条
1 琪东;老年人的听觉变化及调适[N];中国医药报;2004年
2 本报记者 王峰;消除耳朵里的嗡鸣声[N];中国消费者报;2002年
3 湖南主任医师 罗普泉;噪声对人体危害及预防[N];大众卫生报;2006年
中国博士学位论文全文数据库 前2条
1 李克勇;听觉系统声诱发反应的磁声场记录[D];中国协和医科大学;1996年
2 赵祥辉;听觉系统对噪声信号的非线性效应[D];华中科技大学;2012年
中国硕士学位论文全文数据库 前10条
1 赵云静;功能性构音障碍儿童听觉辨别能力的病例对照研究[D];中国医科大学;2003年
2 赵燕;听觉分辨训练增强成年大鼠听觉方位选择性的分子机制[D];华东师范大学;2013年
3 秦晓瑜;基于听觉仿生的听觉谱生成方法研究[D];东北师范大学;2013年
4 徐灵活;噪声性听觉损伤易感豚鼠的差异表达基因筛选研究[D];第二军医大学;2007年
5 朱昱陶;论学习歌曲中听觉模仿与原谱学习的关系[D];云南艺术学院;2014年
6 李萍;大鼠孕期应激对子代听觉系统影响的实验研究[D];郑州大学;2006年
7 李冰瑶;基于听觉场景分析的主旋律提取[D];北京邮电大学;2015年
8 刘迎辉;乙醇胚胎毒性对大鼠听觉系统影响的实验研究[D];第一军医大学;2006年
9 邱会军;耳鸣患者的听觉与非听觉问题的相关研究[D];大连医科大学;2010年
10 杨晓丽;小鼠听觉中枢神经元强度—时间反应特性[D];南方医科大学;2010年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026