收藏本站
《西安科技学院》 2002年
收藏 | 手机打开
二维码
手机客户端打开本文

基于SOFM、VQ与HMM的说话人识别技术研究

杨波  
【摘要】: 说话人识别技术经历了数十年的发展,已经取得了巨大的进步,然而与人类的听觉能力相比还处于初级阶段,与其广阔的应用需求显得力所不及,目前有实力的发展国家都纷纷展开说话人识别技术的研究,我国的863计划也包括该项技术,应该说说话人识别技术已经成为21世纪信息领域中最有发展潜力的技术之一。 论文研究内容集中在说话人识别的策略方面。通过考察分析现有的各种说话人识别技术,认为就目前情况来说,要么是改进现有成熟的主流识别技术进一步提高识别率,要么将现有成熟的主流技术与比较前沿的技术相结合从而找到一种实用的说话人识别技术。基于以上认识,本文将研究重点放在人工神经网络与说话人识别主流技术隐马尔可夫模型(HMM)相结合上以及对HMM的前端处理矢量量化的改善上。提出将VQ说话人识别技术与HMM说话人识别技术相结合,引入自组织特征映射神经网络(SOFM)代替普通VQ识别中的LBG算法进行码书设计、矢量量化的说话人识别策略,并采用了自适应技术,同时建立一个小规模的说话人识别系统以验证所提出的说话人识别策略。 通过理论分析与实验可知,采用SOFM算法代替普通LBG算法可以实现码书训练的全局最优及其训练时间的可控性,采用并行算法可提高计算速度;采用本文所提出的说话人识别策略,与单HMM识别方式相比可以减少前端量化误差,提高HMM的识别精度,由VQ识别结果与HMM识别结果共同决定最终识别结果,提高了系统的可靠性。自适应处理技术的采用使得系统参数可以根据由于如年龄等因素引起说话人声音的变化而作相应的调整。
【学位授予单位】:西安科技学院
【学位级别】:硕士
【学位授予年份】:2002
【分类号】:TN912.3

【引证文献】
中国硕士学位论文全文数据库 前1条
1 刘震;基于隐Markov模型切削过程监测系统研究[D];福建农林大学;2007年
【参考文献】
中国期刊全文数据库 前10条
1 朱晓园;一个对隐马尔可夫模型用于自由语句说话人的研究[J];北方交通大学学报;1997年01期
2 崔屹,张东,时良平,陈丽媛;语音识别中的抗噪声方法[J];北京邮电大学学报;1998年02期
3 李晶皎,孙杰,张俐,姚天顺;语音识别中HMM与自组织神经网络结合的混合模型[J];东北大学学报;1999年02期
4 赵力,刘怡龙,邹采荣,高西奇,吴镇扬;基于VQ-HMM的无教师说话人自适应方法[J];东南大学学报(自然科学版);2001年02期
5 顾明亮,王太君,何振亚;语音信号时间动态规正新方法[J];东南大学学报;1998年02期
6 丁贵祥,王琪,翁默颖;基于数字信号处理方法的话者确认计算机识别系统[J];电子测量与仪器学报;1999年01期
7 史静朴,陈际,陈向东,陈川,王守觉;用神经计算机的说话人确认系统及其应用[J];电子学报;1999年10期
8 王都生,铁满霞,樊昌信;一种实用的双向跟踪基音周期平滑算法[J];电子学报;1999年10期
9 王都生,铁满霞,樊昌信;一种实时基音检测算法[J];电子学报;2000年10期
10 胡光锐,韦晓东;基于倒谱特征的带噪语音端点检测[J];电子学报;2000年10期
【共引文献】
中国期刊全文数据库 前10条
1 丁志中,易茂祥;线性预测误差与自相关函数矩阵之间的关系[J];安徽大学学报(自然科学版);1996年02期
2 孙虹;;粗糙集神经网络系统在车牌字符识别中的研究[J];安徽建筑工业学院学报(自然科学版);2007年04期
3 胡钢,沈文轩;一种基于噪声动态检测的语音端点检测算法[J];鞍山科技大学学报;2004年02期
4 董镭;刘宏;;基于神经网络的车牌识别系统在特定场合的应用[J];鞍山科技大学学报;2007年05期
5 胡钢;;一种语音端点检测算法在DSP上的实现[J];鞍山师范学院学报;2009年06期
6 施俊强,池明敏;基于TMS320C54x DSKplus的实时TCM语音编解码算法的实现[J];半导体技术;2001年08期
7 吕雪梅,赵荣黎;跳频信道切换对模拟话音通信质量的影响[J];北方交通大学学报;1997年01期
8 邓勇,施文康;基于TMS320C50的语音频谱分析仪[J];兵工自动化;2000年03期
9 刘凤娟;基于BP算法的数字式机械臂系统控制[J];兵工自动化;2004年06期
10 范红波;张英堂;任国全;;基于改进ART2神经网络的发动机故障诊断方法[J];兵工自动化;2006年07期
中国重要会议论文全文数据库 前10条
1 郭巧;张立伟;陆际联;;汉语语音信号的端点检测与切分[A];第九届全国信号处理学术年会(CCSP-99)论文集[C];1999年
2 张连海;王杰锋;王炳锡;;基于语音多带激励模型的基音周期估计算法研究[A];第九届全国信号处理学术年会(CCSP-99)论文集[C];1999年
3 司罗;胡起秀;金琴;;完全无监督的双人对话中的说话人分隔[A];第九届全国信号处理学术年会(CCSP-99)论文集[C];1999年
4 牟峰;俞铁城;杨道淳;;新型半波语音编解码的实现[A];第十届全国信号处理学术年会(CCSP-2001)论文集[C];2001年
5 邹绘华;李双田;;基于频谱斜率约束的变速率语音编码算法研究[A];第十届全国信号处理学术年会(CCSP-2001)论文集[C];2001年
6 李灿伟;杨震;;基于DCT的有色噪声消除算法[A];第十届全国信号处理学术年会(CCSP-2001)论文集[C];2001年
7 周珺;范京;刘惠华;;汉语语音音量和语速变化的自适应的调整[A];第十届全国信号处理学术年会(CCSP-2001)论文集[C];2001年
8 孙海;范京;刘惠华;;汉语连续语音中的单字起止点综合判别的新方法[A];第十届全国信号处理学术年会(CCSP-2001)论文集[C];2001年
9 朱学勇;刘亚康;杨乐;;一种基于MBE模型的2.4Kbps语音编码器算法[A];第十届全国信号处理学术年会(CCSP-2001)论文集[C];2001年
10 张玲华;杨震;郑宝玉;;一种修正的倒谱公式及其在说话人识别中的应用[A];第十一届全国信号处理学术年会(CCSP-2003)论文集[C];2003年
中国博士学位论文全文数据库 前10条
1 黄湘松;基于混淆网络的汉语语音检索技术研究[D];哈尔滨工程大学;2010年
2 洪弘;基于Hilbert-Huang变换的汉语动态特征分析[D];南京大学;2010年
3 张寿明;基于冶炼过程及终点判断技术的烟化炉智能控制系统研究[D];昆明理工大学;2009年
4 尹伟;基于模型的语音增强方法及质量评估研究[D];武汉大学;2009年
5 曾庆虎;机械传动系统关键零部件故障预测技术研究[D];国防科学技术大学;2010年
6 黄丽霞;非特定人鲁棒性语音识别中前端滤波器的研究[D];太原理工大学;2011年
7 双志伟;个性化语音生成研究[D];中国科学技术大学;2011年
8 许敏强;基于话者统计特征和SVM的文本无关话者确认研究[D];中国科学技术大学;2011年
9 高二中;对话电话语音的话者确认研究[D];中国科学技术大学;2011年
10 姜永静;指数矩及其在模式识别中的应用[D];北京邮电大学;2011年
中国硕士学位论文全文数据库 前10条
1 王春力;基于P2P的网络音频捕获与多路混音算法研究[D];山东科技大学;2010年
2 楼侃;基于DSP的语音信号环境噪声降噪处理技术的研究[D];长春理工大学;2010年
3 靳志强;报告厅环境下语音增强方法研究[D];郑州大学;2010年
4 徐雯;VDR音频数据数字水印算法研究[D];哈尔滨工程大学;2010年
5 刘维巍;语音信号基音周期检测算法研究[D];哈尔滨工程大学;2010年
6 孙大为;数字化单边带水声语音通信系统的研究与实现[D];哈尔滨工程大学;2010年
7 楼佳;基于网络QoS的AMR语音编码算法研究[D];哈尔滨工程大学;2010年
8 杨文强;基于AMBE-2000的OFDM水声语音通信平台研究[D];哈尔滨工程大学;2010年
9 周翠梅;说话人识别技术的研究与实现[D];大连理工大学;2010年
10 邬鑫锋;基于短时谱估计的语音增强研究[D];湘潭大学;2010年
【同被引文献】
中国期刊全文数据库 前10条
1 刘志艳,王军,杨志学,李叔彦;刀具破损在线监测及其系统的研究[J];燕山大学学报;1998年02期
2 叶大鹏,何聪惠,吴昭同,丁启全;基于小波包的振动攻丝特征提取方法[J];福建农业大学学报;2004年02期
3 郑建明,李言,黄玉美;刀具磨损切削力功率谱特征多分辨分析[J];机床与液压;2002年04期
4 李伯全,王翔;小波包分析在变速箱故障自动诊断中的应用[J];江苏大学学报(自然科学版);2003年02期
5 王维;么健石;蔡光起;;异形螺杆数控铣削刀具磨损智能建模研究[J];机械设计与制造;2006年02期
6 柳新民,邱静,刘冠军;基于AR-连续HMM的故障诊断模型及应用[J];机械科学与技术;2005年03期
7 郑建明,李言,李鹏阳,洪伟,肖继明,袁启龙;基于切削力信号时域频域特征融合的刀具磨损监测[J];机械与电子;2001年03期
8 韩育平,王永梅;切削力监测刀具磨损的一种方法[J];煤矿机械;2004年01期
9 孟俊焕,孙如军,牟书科;基于神经网络的机械加工多传感器信息融合研究[J];机械工程与自动化;2005年03期
10 李鹏阳,李言,郑建明,洪伟,肖继明,袁启龙;基于神经网络刀具磨损的多特征融合监控[J];现代电子技术;2001年03期
中国博士学位论文全文数据库 前2条
1 郑建明;基于HMM的多特征融合钻头磨损监测技术的研究[D];西安理工大学;2004年
2 叶大鹏;基于2D-HMM的旋转机械故障诊断方法及其应用研究[D];浙江大学;2004年
中国硕士学位论文全文数据库 前1条
1 郗长青;基于钻削力信号的钻头磨损状态监测技术的研究[D];西安理工大学;2005年
【二级引证文献】
中国期刊全文数据库 前2条
1 叶大鹏;刘震;;基于AR特征的刀具状态识别方法[J];福建农林大学学报(自然科学版);2007年06期
2 叶大鹏;刘震;张春良;;小波包隐Markov模型刀具状态识别研究[J];南华大学学报(自然科学版);2007年03期
中国硕士学位论文全文数据库 前1条
1 李启铭;基于协整建模的铣刀磨损状态监测技术研究[D];天津大学;2010年
【二级参考文献】
中国期刊全文数据库 前10条
1 陈方,高升;语音识别技术及发展[J];电信科学;1996年10期
2 王都生,铁满霞,樊昌信;一种实用的双向跟踪基音周期平滑算法[J];电子学报;1999年10期
3 战普明,王作英,陆大 ;语音识别隐马尔可夫模型的改进[J];电子学报;1994年01期
4 薛向阳,樊昌信;基于自组织特征映射的图像矢量量化研究[J];电子学报;1995年04期
5 李苇营,易克初,吴文虎,方棣棠;基于有限状态径向基函数网络的汉语语音识别研究[J];电子学报;1996年01期
6 胡光锐,林昱弘;一种改进的混合型语音识别方法[J];上海交通大学学报;1994年06期
7 胡光锐,王昀;一种抗噪声语音识别方法[J];上海交通大学学报;1995年03期
8 胡光锐,吴硕,朱昕波;用于SOM神经网络语音识别的自适应局部搜索算法[J];上海交通大学学报;1996年07期
9 马明,张杰,王建宇,黄志同;语音识别中隐马尔可夫模型初值的估计[J];数据采集与处理;1997年02期
10 王守觉,鲁华祥,陈向东,曾玉娟;人工神经网络硬件化途径与神经计算机研究[J];深圳大学学报;1997年01期
【相似文献】
中国期刊全文数据库 前10条
1 单进;;说话人识别技术研究[J];科技资讯;2010年21期
2 檀蕊莲;;基于VQ的说话人识别技术研究[J];信息技术;2010年08期
3 檀蕊莲;;动态时间规整算法与说话人识别技术研究[J];科技资讯;2010年08期
4 檀蕊莲;;基于DTW的说话人识别技术研究[J];黑龙江科技信息;2010年13期
5 崔玉红,胡光锐,何旭明;基于混合进化计算的GMM优化方法及其在说话人辨认中的应用[J];应用科学学报;2002年02期
6 林平澜;王仁华;;动态HMM及其在说话人识别中的应用[J];信号处理;1993年04期
7 周静芳,陈一宁,李科,刘加;基于高斯语音滤波的稳健文本无关说话人识别[J];计算机工程;2005年02期
8 王刚;郑方;;电话信道下应用DMFCC进行说话人识别[J];清华大学学报(自然科学版);2009年10期
9 邓浩江,王守觉,邢藏菊,李倩;基于聚类统计与文本无关的说话人识别研究[J];电路与系统学报;2001年03期
10 王炜,王炳锡,王波;信道补偿技术的发展及其在说话人识别上的应用[J];电声技术;2004年04期
中国重要会议论文全文数据库 前10条
1 李桂春;郑能恒;李霞;;基于模糊隶属值加权的MFCC特征提取算法[A];第七届和谐人机环境联合学术会议(HHME2011)论文集【poster】[C];2011年
2 司罗;胡起秀;金琴;;完全无监督的双人对话中的说话人分隔[A];第九届全国信号处理学术年会(CCSP-99)论文集[C];1999年
3 刘特安;聂建英;;基于SOFM神经网络的大气窗口最优特征方法研究[A];2009年先进光学技术及其应用研讨会论文集(上册)[C];2009年
4 周昊朗;王岚;陈珂;;一个面向说话人识别的汉语语音数据库[A];第六届全国人机语音通讯学术会议论文集[C];2001年
5 周昊朗;王岚;吴玺宏;迟惠生;;一个面向说话人识别的汉语语音数据库[A];信号与信息处理技术——第一届信号与信息处理联合学术会议论文集[C];2002年
6 侯丽敏;谢娟敏;;共振峰瞬时频率特征用于说话人识别[A];第九届中国语音学学术会议论文集[C];2010年
7 周静芳;陈一宁;刘润生;;一种新的说话人识别信道补偿技术[A];第七届全国人机语音通讯学术会议(NCMMSC7)论文集[C];2003年
8 吴志强;陈珂;迟惠生;;语音识别技术与说话人识别技术的结合——文本无关说话人识别的另一种方法[A];第四届全国人机语音通讯学术会议论文集[C];1996年
9 卓群;欧贵文;;基于模糊高斯混合模型的说话人识别算法的一些改进[A];第六届全国人机语音通讯学术会议论文集[C];2001年
10 王宏;潘金贵;;基于矩阵正态分布的文本有关说话人识别[A];2007通信理论与技术新发展——第十二届全国青年通信学术会议论文集(上册)[C];2007年
中国重要报纸全文数据库 前10条
1 吴长锋;科大讯飞勇夺说话人识别国际大赛第一[N];科技日报;2008年
2 汪永安;科大讯飞说话人识别技术世界领先[N];安徽日报;2008年
3 见习记者 向南;科大讯飞语音识别技术国际领先[N];证券时报;2008年
4 王朝选;科大讯飞语音识别技术取得重大进展[N];中国高新技术产业导报;2008年
5 记者 周军 通讯员 曲红权 祁双杨;攀钢启动改善连铸坯表面质量技术研究[N];中国冶金报;2006年
6 马二海通讯员 刘慧婵;华工工业技术研究总院揭牌[N];广东科技报;2007年
7 本报记者 钱秀丽;十年磨一剑 实现海水梦[N];中国海洋报;2008年
8 张伟;深部资源探测期待飞跃[N];中国黄金报;2008年
9 ;中国航天空气动力技术研究院[N];中国航天报;2008年
10 本报记者 周丽娟;独立公正的定位 任重道远的起步[N];中国汽车报;2003年
中国博士学位论文全文数据库 前10条
1 哈斯巴干;神经网络及其组合算法的遥感数据分类研究[D];中国科学院研究生院(遥感应用研究所);2003年
2 单振宇;情感说话人识别及其解决方法的研究[D];浙江大学;2010年
3 姜涛;网络环境下说话人识别关键技术研究[D];哈尔滨工业大学;2011年
4 黄挺;情感说话人识别中的基频失配及其补偿方法研究[D];浙江大学;2011年
5 李邵梅;文本无关短语音说话人识别技术研究[D];解放军信息工程大学;2011年
6 王莉;数据挖掘中聚类方法的研究[D];天津大学;2004年
7 高晓雷;SOZRSL软件需求规格说明语言及其求精[D];上海大学;2004年
8 俞一彪;基于互信息理论的说话人识别研究[D];上海大学;2004年
9 付中华;说话人识别系统鲁棒性研究[D];西北工业大学;2004年
10 孙俊;基于激励源及其韵律特征的源—目标说话人声音转换研究[D];中国科学技术大学;2006年
中国硕士学位论文全文数据库 前10条
1 杨波;基于SOFM、VQ与HMM的说话人识别技术研究[D];西安科技学院;2002年
2 张伟伟;说话人识别技术的研究[D];燕山大学;2010年
3 李伟娟;基于智能群体和盲源分离的说话人识别[D];兰州理工大学;2010年
4 王芳;说话人识别中一种特征参数的研究[D];安徽工业大学;2010年
5 傅庚申;说话人识别算法研究[D];大连理工大学;2005年
6 潘鹏;会议室环境下基于音频视频信息融合的多说话人识别[D];兰州理工大学;2011年
7 杨延龙;与文本无关的说话人识别的关键技术研究[D];西安电子科技大学;2010年
8 徐良军;基于语音信号时变特性的说话人识别[D];苏州大学;2010年
9 陈文翔;面向OPHONE手机的说话人识别技术移植研究[D];浙江大学;2011年
10 徐海华;说话人识别方法及其系统的应用开发研究[D];华中科技大学;2004年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026