收藏本站
《上海大学》 2004年
收藏 | 手机打开
二维码
手机客户端打开本文

基于互信息理论的说话人识别研究

俞一彪  
【摘要】:基于生物特征的身份识别技术是当前国际上的重点研究内容,自动说话人识别通过语音识别说话人的身份,在系统安全认证、司法鉴定、金融服务以及电子侦听等领域有着广泛的应用价值。本文在对现有说话人识别技术分析的基础上,运用互信息理论进行说话人识别的研究,提出了可实际应用的语音信号互信息计算方法,并针对基于文本和文本无关的说话人识别分别提出了相应的说话人语音模型和互信息匹配算法,实验证明了本文提出的语音信号互信息计算方法的有效性。 本文的主要研究内容如下: 一、对自动说话人识别原理以及相关的语音产生机理和语音信号处理方法作了全面的描述与分析。特别在特征参数选择与提取、说话人语音模型建立、模式匹配以及语音的声学特性方面进行了详细的分析。 二、从信息量的角度考察分析语音信号之间的特征相关性,提出随机干扰信号的概念来解释和描述语音信号之间的失真,并从随机信号的特征以及随机信号分析理论推导出这一信号的统计分布特性,最终,语音信号之间互信息的计算归结到随机干扰信号的熵并得到解决。 三、研究了语音信号互信息计算的具体算法,提出了基于模式的线性映射匹配算法LPM和非线性搜索匹配算法NLM。 四、对互信息测度的聚类特性进行分析,通过类内凝聚度、类间耦合度和类间重叠三大指标对互信息测度的分类特性进行了详细分析,并与其它常用测度Euclidean、Itakura-Saito和Mahalanobis进行比较,结果显示出互信息测度的模式分类有效性和优越性。 五、针对不同识别要求研究适合互信息测度应用的说话人模型,提出应用于基于文本的说活人识别的多模板模型MTM和应用于文本无关说话人识别的全特征矢量集模型CFC,实验证明这些模型能够充分表达说话人的语音特征。 六、对于文本无关的说话人识别,综合考虑距离空间和信息空间的特性,提出多级最小最大
【关键词】:说话人识别 互信息 匹配 语义特征 个性特征
【学位授予单位】:上海大学
【学位级别】:博士
【学位授予年份】:2004
【分类号】:TN912.3
【目录】:
  • 第一章 绪论13-24
  • 1.1 说话人识别基本概念13-16
  • 1.1.1 面向闭集和开集的说话人辨认14
  • 1.1.2 基于文本和文本无关的说话人识别14-15
  • 1.1.3 说话人识别的其它方式15-16
  • 1.2 说话人识别技术的应用16-18
  • 1.3 说话人识别技术的特点18
  • 1.4 说话人识别技术的难点18-21
  • 1.4.1 说话人本身的变化因素19
  • 1.4.2 声音掩饰与仿冒19-20
  • 1.4.3 技术因素20-21
  • 1.5 本文研究工作的意义、基本思路与主要内容21-24
  • 1.5.1 研究意义21
  • 1.5.2 国内外研究现状21-22
  • 1.5.3 研究思路22-23
  • 1.5.4 主要研究工作与创新23-24
  • 第二章 自动说话人识别原理与分析24-36
  • 2.1 特征提取25-29
  • 2.1.1 线性预测系数LPC26-27
  • 2.1.2 线性预测倒谱系数LPCC27-28
  • 2.1.3 Mel频率尺度倒谱系数MFCC28-29
  • 2.2 说话人模型与匹配29-34
  • 2.2.1 基于VQ的码本模型CBM29-32
  • 2.2.2 基于GMM的说话人识别32-33
  • 2.2.3 其它的说话人模型33-34
  • 2.3 决策与判决34-36
  • 第三章 语音信号处理与互信息理论基础36-54
  • 3.1 语音的声学感知特性分析36-43
  • 3.1.1 语谱图分析37-38
  • 3.1.2 韵律特征分析38-39
  • 3.1.3 感知特性分析39-41
  • 3.1.4 说话人个性特征分析41-43
  • 3.2 傅立叶频谱分析43-45
  • 3.3 语音信号短时频谱分析45-50
  • 3.3.1 短时窗的功能45-48
  • 3.3.2 短时帧长度与移动步长48
  • 3.3.3 语音信号的预增强48-50
  • 3.4 小波变换分析50-52
  • 3.5 互信息理论基础52-54
  • 第四章 语音信号互信息的计算54-72
  • 4.1 语音信号互信息的计算分析55-57
  • 4.2 互信息估计的线性映射匹配算法LPM57-58
  • 4.3 互信息估计的非线性搜索匹配算法NLM58-60
  • 4.4 互信息测度的聚类特性分析60-68
  • 4.4.1 类内凝聚度分析61-63
  • 4.4.2 类间耦合度分析63-65
  • 4.4.3 类内类间平均距离比分析65-66
  • 4.4.4 类间重叠分析66-68
  • 4.5 基于互信息匹配的语音识别68-70
  • 4.5.1 数字语音识别实验68-69
  • 4.5.2 语音识别济览器VoiceIE69-70
  • 4.5.3 连续语音识别实验70
  • 4.6 结论70-72
  • 第五章 互信息应用在基于文本的说话人识别72-83
  • 5.1 互信息匹配识别原理73-76
  • 5.1.1 多模板说话人模型MTM73-75
  • 5.1.2 基于模式的非线性搜索互信息匹配与识别判决75-76
  • 5.2 其它匹配识别方法76-77
  • 5.2.1 DTW区配识别方法76-77
  • 5.2.2 GMM区配识别方法77
  • 5.3 实验分析77-81
  • 5.3.1 识别性能分析78-80
  • 5.3.2 识别性能与特征参数的关系80-81
  • 5.3.3 运算效率分析81
  • 5.4 结论81-83
  • 第六章 互信息应用在文本无关的说话人识别83-95
  • 6.1 说话人的全特征矢量集模型83-84
  • 6.2 多级最小最大搜索匹配算法与判决准则84-88
  • 6.2.1 基于互信息评估的文本无关说话人识别原理85
  • 6.2.2 多级最小最大搜索匹配算法MMS85-87
  • 6.2.3 最大互信息判决MMI87-88
  • 6.3 实验分析与比较88-93
  • 6.3.1 实验数据、环境与条件88-89
  • 6.3.2 全特征矢量集大小分析89-91
  • 6.3.3 CFC-MMS的识别性能分析91-92
  • 6.3.4 CFC-MMS与GMM的识别性能比较92-93
  • 6.4 结论93-95
  • 第七章 总结、讨论与展望95-101
  • 7.1 互信息理论的说话人识别应用95-97
  • 7.2 特征参数的有效性分析97-98
  • 7.3 说话人特征子空间分离98-99
  • 7.4 说话人模型的自适应99-101
  • 参考文献101-108
  • 攻读博士学位期间公开发表和已录用的论文108-109
  • 致谢109-111

【引证文献】
中国博士学位论文全文数据库 前2条
1 侯丽敏;基于非线性理论和信息融合的说话人识别[D];上海大学;2005年
2 何新;基于内容的音频信息分类检索技术研究[D];南京理工大学;2007年
中国硕士学位论文全文数据库 前2条
1 朱少雄;声纹识别系统与模式匹配算法研究[D];大连理工大学;2006年
2 陈俊;基于线谱对系数和高斯混合模型的说话人识别技术研究[D];中南大学;2009年
【参考文献】
中国期刊全文数据库 前3条
1 俞一彪,袁保宗;连续语音识别中句法结构知识的利用[J];电子学报;1990年06期
2 岳喜才,伍晓宇,郑崇勋;用神经阵列网络进行文本无关的说话人识别[J];声学学报;2000年03期
3 俞一彪,王朔中;语音识别中互信息测度的聚类特性分析与实验评价[J];信号处理;2002年05期
【共引文献】
中国期刊全文数据库 前10条
1 陈学锋;瞿金平;;注塑机曲肘式合模机构弹性振动的研究[J];工程塑料应用;2008年03期
2 陈文元;李雪梅;迟晓梅;;小波分析与神经网络在结构多处损伤监测中的应用[J];四川建筑科学研究;2006年03期
3 谢晓娣;基于小波包变换的地铁远方短路电流分析[J];安徽电气工程职业技术学院学报;2005年01期
4 李素云;张德祥;;基于小波变换的汽车齿轮箱振动信号故障分析[J];安徽电子信息职业技术学院学报;2012年01期
5 李多田;张伟林;;结构无损检测与小波分析方法[J];安徽建筑工业学院学报(自然科学版);2008年03期
6 张兵;;不同模态振型在梁结构裂缝识别中的差异[J];安徽建筑;2010年02期
7 林雯;;基于计算机视觉和神经网络的芒果外观等级分类研究[J];安徽农业科学;2010年23期
8 孟艳;从小波多尺度思想看李约瑟难题争鸣的现实意义[J];安康师专学报;2005年04期
9 王蓉,谢元旦;基于小波的图像融合算法的实现[J];鞍山科技大学学报;2003年05期
10 董立文,贾朱植,谢元旦,王萍;一种基于小波变换的图像去噪方法[J];鞍山科技大学学报;2004年03期
中国重要会议论文全文数据库 前10条
1 杨辰龙;;曲面变厚度工件超声检测中的波形自动跟踪技术研究[A];中国自动化学会控制理论专业委员会C卷[C];2011年
2 王重阳;彭圆;张风珍;牟林;;CWT奇异值在水中目标回波信号特征提取中的应用[A];中国声学学会水声学分会2011年全国水声学学术会议论文集[C];2011年
3 何正嘉;訾艳阳;陈雪峰;王晓冬;;内积变换原理与机械故障诊断[A];第九届全国振动理论及应用学术会议论文集[C];2007年
4 段培超;;基于小波变换和CB形态学的航空图像边缘检测[A];图像图形技术与应用进展——第三届图像图形技术与应用学术会议论文集[C];2008年
5 俞一彪;顾晓东;赵鹤鸣;;基于关键词的句法分析及在连续语音识别中的应用[A];第九届全国信号处理学术年会(CCSP-99)论文集[C];1999年
6 林梓;宋鹏;;基于小波变换的1/f类分形信号的噪声抑制[A];第十届全国信号处理学术年会(CCSP-2001)论文集[C];2001年
7 刘东辉;孙晓云;孙会琴;郭立炜;;一种有效去除测量噪声的新方法[A];第十一届全国信号处理学术年会(CCSP-2003)论文集[C];2003年
8 邹博文;李静波;王国华;;基于小波分析的电喷汽油机失火诊断研究[A];2007年APC联合学术年会论文集[C];2007年
9 吴铁洲;周杨;柏祎山;黄圣超;;下一代光网络动态带宽分配策略[A];湖北省电工技术学会、武汉电工技术学会2008年学术年会暨理事会换届大会论文集[C];2008年
10 董新洲;毕见广;;配电线路暂态行波的分析和接地选线研究[A];中国水力发电工程学会继电保护专业委员会成立大会暨学术研讨会学术论文集[C];2005年
中国博士学位论文全文数据库 前10条
1 邹玮;荧光分子断层图像的重建技术研究[D];苏州大学;2010年
2 张峰;输电线路行波故障测距优化算法研究[D];山东大学;2010年
3 赵鹏;离心泵振动故障诊断方法研究及系统实现[D];华北电力大学(北京);2011年
4 刘劲;基于X射线脉冲星的航天器自主导航方法研究[D];华中科技大学;2011年
5 李鹏辉;基于图像处理技术和小波方法的结构损伤识别[D];华中科技大学;2011年
6 彭俊;黄河水沙变化过程及其三角洲沉积环境演变[D];华东师范大学;2011年
7 唐懿文;计算机视频泄漏信号监测平台研究[D];华东师范大学;2011年
8 徐晓东;基于CCSDS IDC星载图像压缩算法的FPGA实现技术[D];山东大学;2011年
9 张青哲;土基振动压实系统模型与参数研究[D];长安大学;2010年
10 吴文杰;基于信息融合的航空发动机故障诊断方法[D];电子科技大学;2011年
中国硕士学位论文全文数据库 前10条
1 杨焱麟;基于小波变换理论与比值分析法的变压器励磁涌流识别的研究[D];山东科技大学;2010年
2 赵奇;医学超声图像三维重建算法研究[D];山东科技大学;2010年
3 吴国曾;实时信号小波分析中边界处理方法及应用[D];郑州大学;2010年
4 解保忠;计算机在矽肺病早期诊断及预测中的应用研究[D];哈尔滨工程大学;2010年
5 朱明;基于信息熵的导航传感器故障诊断技术研究[D];哈尔滨工程大学;2010年
6 杨维洲;基于数学形态学和亚像素提取的图像检测算法研究[D];哈尔滨工程大学;2010年
7 叶东华;基于全景视觉的图像配准方法研究[D];哈尔滨工程大学;2010年
8 李建军;基于电力系统的电能质量检测与分析[D];哈尔滨工程大学;2010年
9 马稳;基于支持向量机的模拟电路故障诊断研究[D];大连理工大学;2010年
10 袁铄;基于小波网络音频信号处理技术[D];大连理工大学;2010年
【同被引文献】
中国期刊全文数据库 前10条
1 甄斌,吴玺宏,刘志敏,迟惠生;语音识别和说话人识别中各倒谱分量的相对重要性[J];北京大学学报(自然科学版);2001年03期
2 王逸军;低码率语音编码的线谱对实现[J];重庆邮电学院学报;1999年01期
3 江铭虎,朱小燕,袁保宗;语音识别与理解的研究进展[J];电路与系统学报;1999年02期
4 赵力,邹采荣,吴镇扬;HMM在说话人识别中的应用[J];电路与系统学报;2001年03期
5 陈雪勤,赵鹤鸣,陈小平;基于计算听觉场景分析的强噪声背景下基音检测方法[J];电路与系统学报;2003年03期
6 熊飞;张雪英;;基于OMAP5912平台的自适应双门限语音端点检测[J];电脑开发与应用;2008年02期
7 方杰;李英;钱红;;一种连续词端点检测的改进方法[J];电声技术;2006年08期
8 王书诏;邱天爽;;说话人识别研究综述[J];电声技术;2007年01期
9 胡益平;蔡骏;洪青阳;;基于GMM的实时说话人识别系统[J];电声技术;2007年06期
10 陈方,高升;语音识别技术及发展[J];电信科学;1996年10期
中国重要会议论文全文数据库 前2条
1 袁中选;余崇智;;采用LSP参数为特征的话者识别研究[A];第二届全国人机语音通讯学术会议论文集[C];1992年
2 李净;徐明星;张继勇;郑方;吴文虎;方棣棠;;汉语连续语音识别中声学模型基元比较:音节、音素、声韵母[A];第六届全国人机语音通讯学术会议论文集[C];2001年
中国博士学位论文全文数据库 前10条
1 钟金宏;基于音节的汉语连续语音声调识别方法研究[D];合肥工业大学;2001年
2 王辰;多媒体融合分析技术的研究与实现[D];中国人民解放军国防科学技术大学;2002年
3 郑术蓉;线性不等式约束下的EM算法[D];吉林大学;2004年
4 陈立伟;基于HMM和ANN的汉语语音识别[D];哈尔滨工程大学;2005年
5 李波;语音转换的关键技术研究[D];国防科学技术大学;2005年
6 唐发明;基于统计学习理论的支持向量机算法研究[D];华中科技大学;2005年
7 李忠伟;支持向量机学习算法研究[D];哈尔滨工程大学;2006年
8 郑贵滨;基于内容的音频信息检索技术研究[D];哈尔滨工业大学;2006年
9 梁永全;基于内容的多媒体信息检索的研究[D];中国科学院研究生院(计算技术研究所);1999年
10 姚志强;说话人识别中提高GMM性能方法的研究[D];中国科学技术大学;2006年
中国硕士学位论文全文数据库 前10条
1 程捷;辅助视频内容分析的音频技术研究与实现[D];中国人民解放军国防科学技术大学;2003年
2 刘翔;多媒体信息综合检索的关键技术研究[D];浙江大学;2004年
3 张荣强;说话人识别中特征提取的方法研究[D];大连理工大学;2005年
4 夏敏磊;语音端点检测技术研究[D];浙江大学;2005年
5 白亮;音频分类与分割技术研究[D];国防科学技术大学;2004年
6 袁玉倩;改进的基于矢量量化的文本相关说话人识别方法研究[D];河北工业大学;2006年
7 赵彦平;孤立词小词汇量抗噪声语音识别方法的研究[D];吉林大学;2006年
8 王红睿;基于连续隐马尔可夫模型的说话人识别[D];吉林大学;2006年
9 李明;基于内容的音频检索的研究与实现[D];哈尔滨工业大学;2006年
10 王书诏;基于高斯混合模型的说话人识别系统的研究[D];大连理工大学;2006年
【二级引证文献】
中国期刊全文数据库 前3条
1 周萍;唐李珍;;基于信息融合的短语音说话人识别方法研究[J];计算机工程;2011年02期
2 何朝霞;潘平;罗辉;;基于非线性共振的说话人特征提取研究与仿真[J];科学技术与工程;2012年25期
3 王池社;张燕;;基于内容的音频数据库的构建与应用[J];微计算机信息;2010年33期
中国硕士学位论文全文数据库 前6条
1 金银燕;基于时频特征的说话人识别研究[D];江南大学;2011年
2 姬鹏宇;色情视频的音频辅助识别[D];北京邮电大学;2011年
3 侯媛媛;基于摩尔斯码的声韵母汉语语音识别皮肤听声器的研究[D];陕西科技大学;2012年
4 朱志婷;基于SVM的音频分类理论研究及应用[D];华南理工大学;2012年
5 高晓红;基于非线性理论的汉语语音的分析及预测[D];中南大学;2012年
6 于庆栋;智能轮椅语音识别与控制系统的研究与实现[D];江苏科技大学;2012年
【二级参考文献】
中国期刊全文数据库 前3条
1 俞一彪,袁保宗;BJD-I汉语理解系统的研究[J];电子学报;1987年04期
2 俞一彪,赵鹤鸣,周旭东;语音识别浏览器VoiceIE设计与实现[J];数据采集与处理;2002年01期
3 俞一彪,赵鹤鸣,周旭东;语音信号互信息估计的非线性搜索算法及识别应用[J];信号处理;2002年02期
【相似文献】
中国期刊全文数据库 前10条
1 马建,郭建东;说话人识别技术研究[J];福建电脑;2005年01期
2 林平澜;王仁华;;动态HMM及其在说话人识别中的应用[J];信号处理;1993年04期
3 周静芳,陈一宁,李科,刘加;基于高斯语音滤波的稳健文本无关说话人识别[J];计算机工程;2005年02期
4 邓浩江,王守觉,邢藏菊,李倩;基于聚类统计与文本无关的说话人识别研究[J];电路与系统学报;2001年03期
5 王炜,王炳锡,王波;信道补偿技术的发展及其在说话人识别上的应用[J];电声技术;2004年04期
6 余华,赵力,吴镇扬;基于FVQ的说话人识别系统的DSP实现[J];电声技术;2004年08期
7 廖贵成,罗文广;一种基于说话人识别技术的自动音量控制系统[J];桂林电子工业学院学报;2004年06期
8 韩雁,陈利华;说话人计算机识别系统的设计与实现[J];浙江大学学报(工学版);2001年02期
9 吴晓娟,韩先花,聂开宝;模糊C-均值(FCM)聚类法与矢量量化法相结合用于说话人识别[J];电子与信息学报;2002年06期
10 单进;;说话人识别技术研究[J];科技资讯;2010年21期
中国重要会议论文全文数据库 前10条
1 李桂春;郑能恒;李霞;;基于模糊隶属值加权的MFCC特征提取算法[A];第七届和谐人机环境联合学术会议(HHME2011)论文集【poster】[C];2011年
2 司罗;胡起秀;金琴;;完全无监督的双人对话中的说话人分隔[A];第九届全国信号处理学术年会(CCSP-99)论文集[C];1999年
3 周昊朗;王岚;陈珂;;一个面向说话人识别的汉语语音数据库[A];第六届全国人机语音通讯学术会议论文集[C];2001年
4 周昊朗;王岚;吴玺宏;迟惠生;;一个面向说话人识别的汉语语音数据库[A];信号与信息处理技术——第一届信号与信息处理联合学术会议论文集[C];2002年
5 侯丽敏;谢娟敏;;共振峰瞬时频率特征用于说话人识别[A];第九届中国语音学学术会议论文集[C];2010年
6 周静芳;陈一宁;刘润生;;一种新的说话人识别信道补偿技术[A];第七届全国人机语音通讯学术会议(NCMMSC7)论文集[C];2003年
7 吴志强;陈珂;迟惠生;;语音识别技术与说话人识别技术的结合——文本无关说话人识别的另一种方法[A];第四届全国人机语音通讯学术会议论文集[C];1996年
8 卓群;欧贵文;;基于模糊高斯混合模型的说话人识别算法的一些改进[A];第六届全国人机语音通讯学术会议论文集[C];2001年
9 王宏;潘金贵;;基于矩阵正态分布的文本有关说话人识别[A];2007通信理论与技术新发展——第十二届全国青年通信学术会议论文集(上册)[C];2007年
10 罗海风;龙长才;;多话者环境下说话人辨识听觉线索研究[A];中国声学学会2009年青年学术会议[CYCA’09]论文集[C];2009年
中国重要报纸全文数据库 前10条
1 汪永安;科大讯飞说话人识别技术世界领先[N];安徽日报;2008年
2 吴长锋;科大讯飞勇夺说话人识别国际大赛第一[N];科技日报;2008年
3 王朝选;科大讯飞语音识别技术取得重大进展[N];中国高新技术产业导报;2008年
4 见习记者 向南;科大讯飞语音识别技术国际领先[N];证券时报;2008年
5 新城;小声音 大前景[N];计算机世界;2006年
6 东南大学计算机科学与工程学院 万维网科学研究所 胡伟瞿裕忠;本体匹配:搭桥异构本体[N];计算机世界;2007年
7 田捷 陈新建 杨鑫;指纹识别算法仍有优化空间[N];计算机世界;2006年
8 义川;Web 3.0更有前途?[N];网络世界;2006年
9 义川;Google沉浮[N];网络世界;2006年
10 王洁;中国雅虎推出“一页到位”搜索平台[N];科技日报;2007年
中国博士学位论文全文数据库 前10条
1 俞一彪;基于互信息理论的说话人识别研究[D];上海大学;2004年
2 单振宇;情感说话人识别及其解决方法的研究[D];浙江大学;2010年
3 姜涛;网络环境下说话人识别关键技术研究[D];哈尔滨工业大学;2011年
4 王尔玉;基于若干声纹信息空间的说话人识别技术研究[D];中国科学技术大学;2012年
5 黄挺;情感说话人识别中的基频失配及其补偿方法研究[D];浙江大学;2011年
6 李邵梅;文本无关短语音说话人识别技术研究[D];解放军信息工程大学;2011年
7 王文晶;基于重力和环境特征的水下导航定位方法研究[D];哈尔滨工程大学;2009年
8 孙俊;基于激励源及其韵律特征的源—目标说话人声音转换研究[D];中国科学技术大学;2006年
9 梁莹;INS/地磁匹配组合导航系统技术研究[D];哈尔滨工程大学;2010年
10 付中华;说话人识别系统鲁棒性研究[D];西北工业大学;2004年
中国硕士学位论文全文数据库 前10条
1 张伟伟;说话人识别技术的研究[D];燕山大学;2010年
2 李伟娟;基于智能群体和盲源分离的说话人识别[D];兰州理工大学;2010年
3 王芳;说话人识别中一种特征参数的研究[D];安徽工业大学;2010年
4 傅庚申;说话人识别算法研究[D];大连理工大学;2005年
5 潘鹏;会议室环境下基于音频视频信息融合的多说话人识别[D];兰州理工大学;2011年
6 杨延龙;与文本无关的说话人识别的关键技术研究[D];西安电子科技大学;2010年
7 徐良军;基于语音信号时变特性的说话人识别[D];苏州大学;2010年
8 陈文翔;面向OPHONE手机的说话人识别技术移植研究[D];浙江大学;2011年
9 徐海华;说话人识别方法及其系统的应用开发研究[D];华中科技大学;2004年
10 陈强;基于GMM的说话人识别系统研究与实现[D];武汉理工大学;2010年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026