收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

人耳声源定位与编码技术研究

周成  
【摘要】:目前随着3D电影与3D电视的蓬勃发展,以3D音视频为代表的新型多媒体娱乐视听技术得到国家战略支持,3D音视频技术迎来了前所未有的发展机遇,特别是对于3D音频技术,其发展与3D视频技术是不对等的。在传统的多媒体技术领域,我们的起步和发展都落后于西方发达国家,多年来处于“跟随”的状态。但是,在刚刚兴起的3D音频技术领域,我们则有机会与世界上各发达国家在同一起跑线上参与竞争,从而实现从“跟随”到“主导”的跨越式发展。虽然应用需求和产业的发展为3D音频技术的发展提供了难得的机遇,但3D音频技术研究尚处于初级阶段,还面临着许多问题和挑战:1)目前最新3D音频技术从平面声场中提取诸如风雨声的特殊空间声效以产生虚拟三维空间音效,由于未真正提取声源三维空间信息,无法真实重现三维空间声场;2)目前3D音频幅度矢量合成技术通过控制声源对象到不同扬声器的幅度衰减和时间延迟来制造空间位置感,由于不符合人耳对声源的垂直方位感知机理因而效果欠佳;3)3D音频将声场从平面扩展到三维空间,表征声源空间信息数据量急剧增加,庞大的3D音频空间信息数据量对数据压缩提出了严峻的挑战。 本论文在国家科技重大专项课题“新型移动多媒体音视频编解码关键技术研发”(No.2010ZX03004-003)、国家自然科学基金重点项目“移动音频编解码基础理论与关键技术”(No.60832002)与武汉大学自主科研项目“基于空间音频线索的安防监控音源定位和分离技术研究”(No.20102110101000099)等多项纵向课题的资助下,研究3D音频中的声源空间信息获取与海量空间信息数据压缩问题。本论文研究基于空间线索的声源水平定位技术、基于频谱线索的声源垂直定位技术和基于空间线索帧间分布特性的空间音频预测编码技术。其中基于空间线索的声源水平定位技术和基于频谱线索的声源垂直定位技术为声源空间信息获取提供理论支撑;基于频谱线索的声源垂直定位技术为3D声场合成提供理论支撑;基于空间线索帧间分布特性的空间音频预测编码技术为海量空间信息数据压缩提供理论支撑,具有较为重要的理论意义与应用价值。 本论文在理论模型方法以及应用实践方面具有如下贡献和创新: (1)基于多普勒效应自适应修正的移动声源水平定位模型 基于空间线索ITD和ILD的声源水平定位方法是在获取静止场景声源ITD、ILD、频率和水平方位角统计分布的基础上来实现声源水平定位,而在移动声源场景下由于多普勒效应的存在使声源的接受频率发生了变化从而使得对声源水平方位的估计出现偏差。针对此问题本论文提出一种基于多普勒效应自适应修正的移动声源水平定位模型,在获取ITD、ILD和水平方位角统计分布后,通过分析多普勒效应导致的频率变化对基于ITD和ILD联合估计的声源定位模型中的联合概率密度计算方法进行修正以去除多普勒效应带来的影响,使之适用于移动场景下的声源定位。声学实验表明:本论文提出的移动声源定位改进方法与国际前沿研究方法相比在静音条件下声源分别以1米/秒、5米/秒和10米/秒移动时声源水平定位平均准确率分别提升了0.3%、5.7%和10.5%。 (2)适用于不同声源的频谱线索垂直定位模型 基于频谱线索的声源垂直定位方法通过建立频谱线索-仰角映射统计的方法来实现声源垂直方位估计,由于频响中哪些波峰和波谷可准确表征声源的垂直方位与声源类型相关,一旦声源类型发生变化,原有的频谱线索-仰角映射统计便不再适用,因而无法适用于各种不同的声源。针对此问题本论文提出一种适用于不同声源的频谱线索垂直定位模型。分别针对噪声、语音和音乐信号确定其频响信号中哪些波峰和波谷可作为表征声源垂直方位的关键特征,并获取此关键特征与声源高度角间的统计分布,定位时首先通过声音分类器确定声源类型,然后选取其对应的频谱线索关键特征及相关频谱线索统计分布进行声源垂直方位估计。声学实验表明:本论文提出的频谱线索垂直定位改进方法与国际前沿研究方法相比在静音条件对噪声、语音和音乐的声源垂直定位平均准确率分别提升了2.3%、6.6%和16.4%。 (3)基于空间线索帧间分布特性的空间音频高阶预测模型 针对目前国际空间音频编码技术中普遍采用的帧内差分预测和帧间差分预测编码方法,只是将空间线索上一子带作为本子带的预测值,或者将空间线索上一帧作为本帧的预测值,未充分利用声源空间线索帧间分布特性来设计预测算法从而使得预测效果欠佳的问题,本论文在对空间线索帧间差值统计分布进行分析后提出了一种基于空间线索帧间分布特性的贝叶斯高阶预测模型,并于MPEG Surround空间音频编码器上进行了实现,与帧内差分和帧间差分预测方法相比更大程度地去除了空间线索帧间相关性冗余。实验表明:本论文提出的基于空间线索帧间分布特性的空间音频高阶预测方法与MPEG Surround预测编码方法相比码率降低约20%。 综上所述,本论文研究成果包括基于多普勒效应自适应修正的移动声源水平定位方法、适用于不同声源的频谱线索垂直定位方法和基于空间线索帧间分布特性的空间音频预测编码方法,对于3D音频中的声源空间信息获取与海量空间信息数据压缩应用具有重要的理论意义与应用价值。最后本论文总结了全文的研究成果,并对未来的研究工作予以展望。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 陈妍;;基于单片机的数字助听器设计平台研究[J];煤炭技术;2011年08期
2 刘哲;陈日林;滕鹏晓;杨亦春;;阵列声成像系统的设计[J];微计算机应用;2011年07期
3 黄晨曦;吴鸣;杨军;;数字传声器阵列声源定位FPGA实现[J];电声技术;2011年05期
4 张作楠;刘国栋;娄建;;低空运动目标的多传感器自动识别和实时跟踪[J];计算机应用研究;2011年08期
5 曲少春;王英民;郑琨;;基于匹配场和时间反转法的浅海声源定位研究[J];计算机仿真;2011年07期
6 龚小章;;特定声识别与定位系统[J];电子科技;2011年08期
7 ;[J];;年期
8 ;[J];;年期
9 ;[J];;年期
10 ;[J];;年期
11 ;[J];;年期
12 ;[J];;年期
13 ;[J];;年期
14 ;[J];;年期
15 ;[J];;年期
16 ;[J];;年期
17 ;[J];;年期
18 ;[J];;年期
19 ;[J];;年期
20 ;[J];;年期
中国重要会议论文全文数据库 前10条
1 程丽娟;应丽美;Olivia Gosseries;王付言;张瑛;喻森明;胡晓华;余丹;李景琦;高鸿兴;何敏慧;Caroline Schnakers;狄海波;;严重意识障碍患者声源定位的评估:唤名与铃声的比较[A];首届全国脑外伤治疗与康复学术大会论文汇编(中)[C];2011年
2 范京;罗倩;曾义芳;;平面麦克风阵列估计声源的方向和距离[A];全国第4届信号和智能信息处理与应用学术会议论文集[C];2010年
3 刘月婵;孙超;何元安;;旋转式阵列声源定位技术研究[A];中国声学学会水声学分会2011年全国水声学学术会议论文集[C];2011年
4 胡涛;蒋德军;王涛;;简正波展开与声源定位[A];中国声学学会1999年青年学术会议[CYCA'99]论文集[C];1999年
5 黄益旺;杨士莪;吕钱浩;;基于时延的匹配场声源定位[A];中国声学学会2002年全国声学学术会议论文集[C];2002年
6 黄益旺;杨士莪;朴胜春;;远距离声源被动定位新方法研究[A];2004年全国水声学学术会议论文集[C];2004年
7 全海英;张旭;邓军民;于红玉;徐瑾;孙涌;何宝新;水玉海;王宁宇;;声源定位测听系统的设计[A];中国生物医学工程进展——2007中国生物医学工程联合学术年会论文集(上册)[C];2007年
8 汪增福;刘克辉;王东;韩文善;;基于声压幅度比的声源定位[A];2001年中国智能自动化会议论文集(下册)[C];2001年
9 马光彦;王伟策;蒋新胜;罗珊;;一种高精度声源自动跟踪系统的设计[A];第二届全国信息获取与处理学术会议论文集[C];2004年
10 钟小丽;谢菠荪;;衣服、耳廓对肩部反射及头相关传输函数的综合影响[A];2005年声频工程学术交流会论文集[C];2005年
中国博士学位论文全文数据库 前10条
1 周成;人耳声源定位与编码技术研究[D];武汉大学;2011年
2 郭小霞;水下结构辐射噪声源快速诊断识别研究[D];哈尔滨工程大学;2012年
3 黄益旺;浅海远距离匹配场声源定位研究[D];哈尔滨工程大学;2005年
4 崔玮玮;基于麦克风阵列的声源定位与语音增强方法研究[D];清华大学;2009年
5 吕晓玲;基于听觉信息的机器人声源定位技术研究[D];河北工业大学;2010年
6 张同华;基于声发射技术的PE/PE自增强复合材料损伤检测研究[D];东华大学;2008年
7 王庆生;微型生物听觉系统的定向机理及仿生声感应结构的设计和实验研究[D];上海交通大学;2010年
8 时洁;基于矢量阵的水下噪声源近场高分辨定位识别方法研究[D];哈尔滨工程大学;2009年
9 汤永清;空间听觉特征提取与3D音频再现研究[D];上海大学;2011年
10 金乃高;音视频联合说话人定位与跟踪方法研究[D];大连理工大学;2008年
中国硕士学位论文全文数据库 前10条
1 杨超;声源二维定位估计算法研究[D];沈阳理工大学;2011年
2 刘磊;基于信号能量修正的声源定位算法研究[D];辽宁大学;2012年
3 冯知非;嵌入式超音速子弹声源定位技术研究[D];北京交通大学;2011年
4 孙玉玲;高压水射流靶物反射声信号的声源分离及定位[D];安徽理工大学;2012年
5 张青;基于时延估计的声源定位算法的研究[D];北方工业大学;2012年
6 柯昆;声源定位技术研究[D];西安电子科技大学;2010年
7 范嘉隽;基于无线传感器网络的声源定位系统的设计与实现[D];上海交通大学;2010年
8 曹虎林;基于麦克风阵列的声源定位系统硬件设计与算法研究[D];上海交通大学;2011年
9 王利平;基于麦克风阵列的声源定位技术研究[D];燕山大学;2012年
10 施爱春;分布式声源定位与跟踪算法研究[D];复旦大学;2011年
中国重要报纸全文数据库 前2条
1 聂廷晋、特约记者赵荣涛;10余项成果获国家和省部级立项资助[N];人民武警;2010年
2 本报记者 钱怡 徐磊;“机器人运动”喜忧录[N];苏州日报;2010年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978