基于物理模型的声音合成技术理论研究
【摘要】:
基于物理模型的声音合成技术是建立在声学、力学、数学和信号处理等理论基础之上的一门科学,它主要根据力学原理,通过振动偏微分方程、振动体的边界条件、振动的初始条件和激励条件来描述物体的振动物理特性。与其它合成技术不同的是:它是对声音产生的物理机制的描述,而不是对声音本身的描述,而其它方法则是对音频本身的时频特征的描述。
从物理特性上来说,管乐器(wind)、弦乐器(string)、长笛(flute)等可以用一维PDE来描述,鼓(drum)、锣(gong)、钹(cymbal)等可以用二维PDE来描述。由于它可以精确地描述物体的发声及其发声过程,精确地再现乐器的基波、高次谐波、非谐波以及ASDR过程,象真实乐器一样可以表达演奏者的演奏力度、速度、风格和情感,随着计算机处理速度的提高,尤其是MPEG4技术的公布,这种方法日趋活跃,成为目前乐器仿真、声音合成的研究热点。
作为一种可以精确描述物体发声而有广阔发展前景的技术,物理模型的历史还相对比较短暂,可以说它生于1970年代,培育于1980年代,成长于1990年代,至今尚未成熟而处于发展期,其主要标志是理论上的不完善和应用上的不足。在理论上,物理模型方法还存在基本模型不完善、不规则边界和激励条件数学模型难以建立等诸多不足,需要我们进一步去深入研究。
本文阐述了物理模型方法中各种技术,比较了各自的优缺点,分析了部分理想弦乐器和膜乐器的特性,重点研究了两个著名的传统一维和二维阻尼振动方程的局限性,建立了新的模型,其具体成果如下:
1.拨弹弦为例,从理论上详细地分析了著名的传统一维阻尼振动方程的局限性,并从仿真试验上对其局限性进行了验证。
2.根据振动和力学理论推导出了新的一维模型,从理论上证明了其收敛性,并从仿真试验上证明了其精确性。
3.以矩形膜和圆形膜为例,从理论上详细地分析了传统二维阻尼振动方程的局限性。
4.根据振动和力学理论推导出了新的二维模型,并从理论上证明了其收敛性。