噪音环境下的说话人识别
【摘要】:语音信号处理技术是信息社会不可或缺的技术,说话人识别是语音信号处理的一个重要研究领域。说话人识别研究历史较长,仍有许多问题有待研究解决,噪音环境下的说话人识别即是其一。本文研究噪音环境下说话人识别的方法技术。
全文共分六章。第一章,研究背景;第二章,语音信号处理基础;第三章,语音增强;第四章,语音信号的端点检测;第五章,说话人识别和特征参数提取;第六章,基于隐马尔可夫模型的说话人识别;最后是结论、建议与致谢。
通过对语音信号处理和说话人识别的系统学习和研究,取得了以下成果:
(1)提取出语音信号的美尔倒谱和一阶差分美尔倒谱参数。
(2)应用减谱法的原理,通过对噪声统计分析,实现了对输入语音信号的增强处理,提高了语音的清晰度和可懂度,接近还原出原始语音信号。
(3)通过对噪声特性的分析,设计了自动识别背景噪声的端点检测方法,并提出了基于子带减法的带噪语音端点检测算法。自适应区分准静音环境和噪音环境,并检出字或词组的语音序列。
(4)设计了识别系统中使用的隐马尔可夫模型的数据结构,应用自左至右和各态历经两种隐马尔可夫模型实现了说话人识别,并对两种模型使用了相同的数据进行训练和测试,对每一种模型应用不同长度的训练和识别数据,测试了得到理想识别结果最短训练和识别数据长度。