收藏本站
《上海大学》 2005年
收藏 | 手机打开
二维码
手机客户端打开本文

基于非线性理论和信息融合的说话人识别

侯丽敏  
【摘要】: 说话人识别是一种生物特征识别技术,它是指机器通过说话人的语音自动识别出说话人的身份。在信息接入服务安全控制、司法鉴定、金融服务、电子侦听和人机界面智能化等领域这项技术具有良好的应用前景。说话人识别主要经过三个阶段来实现——提取特征、建立说话人模型、判决。特征提取阶段是第一步,也是非常重要的一步。如果不能提取充分反映说话人个性特征的特征量,后两步的优化就很难奏效。现有特征提取方法大都是建立在把语音信号当作短时平稳信号的认识基础上的,这些特征用于说话人识别取得了较好的效果,但是人们在设法进一步提高系统的识别率和鲁棒性时发现了它的局限性。针对这种情况,本文基于当前非线性动力的混沌、分形数学在许多物理现象特别是语音信号处理中的应用,提出采用动力系统模型分析语音信号,抽取混沌、分形特征描述语音信号,并且将这些特征应用于说话人识别,探讨非线性参数区别不同人的声音的有效性,以进一步提高说话人识别的正确识别率。 本文首先深入分析语音信号的混沌机理。由自相关函数确定延迟时间,用虚假近邻法确定嵌入维数,据此重构相空间。根据实验数据计算汉语38个音素的最大Lyapunov指数,其数值均为正值,验证了语音信号的混沌性。在此基础上研究非线性动力学在说话人识别中的应用,取得的创新研究成果可归纳如下: (1)基于Kolomogorov熵和广义维数、关联维数之间的联系,利用GP相关算法实现语音信号关联维数的计算,并得到Kolomogorov熵和广义维数的计算方法,使语音信号的各种非线性参数的计算统一起来。 (2)提出用广义维数Dq为说话人的特征参数,进行说话人识别。广义维数作为多维矢量比其他研究成果中使用的单一的一维分形维数更详细地描述了语音信号的非线性特性。在与文本无关的实验中,对Dq采用马氏距离,并结合其一次差分和二次差分,明显提高了说话人辨认的正确识别率,表明了广义维数作为说话认识别特征的有效性。还进一步讨论短时帧长度对估计Dq的影响,适当增加帧长使识别率得到提高。与采用传统特征参数的说话人识别进行了对比实验,显示出广义维数能够区分不同的说话人,可与传统参数结合起来共同完成识别任务。
【学位授予单位】:上海大学
【学位级别】:博士
【学位授予年份】:2005
【分类号】:TN912.34

【引证文献】
中国期刊全文数据库 前2条
1 周萍;唐李珍;;基于信息融合的短语音说话人识别方法研究[J];计算机工程;2011年02期
2 何朝霞;潘平;罗辉;;基于非线性共振的说话人特征提取研究与仿真[J];科学技术与工程;2012年25期
中国硕士学位论文全文数据库 前1条
1 高晓红;基于非线性理论的汉语语音的分析及预测[D];中南大学;2012年
【参考文献】
中国期刊全文数据库 前10条
1 甄斌,吴玺宏,刘志敏,迟惠生;语音识别和说话人识别中各倒谱分量的相对重要性[J];北京大学学报(自然科学版);2001年03期
2 周越,杨杰;求解关联维数的快速算法研究[J];电子学报;2002年10期
3 韦岗,陆以勤,欧阳景正;混沌、分形理论与语音信号处理[J];电子学报;1996年01期
4 方绍武,戴蓓倩,陆伟;基于方差归一化失真测度的改进的LBG算法[J];计算机工程与应用;2000年02期
5 蓝金辉,马宝华,蓝天,周兆英;D-S证据理论数据融合方法在目标识别中的应用[J];清华大学学报(自然科学版);2001年02期
6 陈刚,戚飞虎;多分类器结合的人脸识别[J];上海交通大学学报;2001年02期
7 王宏,向大威;基于长时平均频谱的“文本无关”话者识别[J];声学技术;2002年Z1期
8 陈国,胡修林,张蕴玉,朱耀庭;基于短时分形维数的汉语语音自动分段技术研究[J];通信学报;2000年10期
9 林嘉宇,王跃科,黄芝平,沈振康;一种新的基于混沌的语音、噪声判别方法[J];通信学报;2001年02期
10 胡水清,张宇,华一满,杜功焕;汉语语音的非线性动力学特性分析[J];声学学报;2000年04期
中国博士学位论文全文数据库 前1条
1 俞一彪;基于互信息理论的说话人识别研究[D];上海大学;2004年
【共引文献】
中国期刊全文数据库 前10条
1 万俊;邢焕革;刘亮;;基于D-S证据理论的决心方案评价研究[J];兵工自动化;2008年07期
2 林琳;王树勋;王秀丽;;基于DSP开集说话人识别系统的实时实现[J];吉林大学学报(信息科学版);2006年03期
3 张武江;非线性动力学与语言研究[J];重庆工学院学报;2004年06期
4 王越;韩菁;;信息融合技术在火灾探测中的应用[J];重庆理工大学学报(自然科学版);2011年01期
5 田亮,曾德良,刘鑫屏;数据融合方法在火灾监测系统中的应用[J];传感器技术;2003年09期
6 李斌,陈以,韩元杰;一种改进的多传感器敌我识别算法[J];传感器技术;2005年07期
7 覃频频;许登元;黄大明;;基于D-S证据理论的高速公路事件检测信息融合[J];传感器与微系统;2007年04期
8 王立刚;牟海维;张勇;;基于专家知识的数据融合技术研究[J];传感器与微系统;2007年10期
9 奚婷婷;熊伟丽;张林;徐保国;;基于D-S算法的小波理论在温室控制中的应用研究[J];传感器与微系统;2008年11期
10 鲍必赛;伍健荣;楼晓俊;刘海涛;;无线传感器网络信息时空融合模型与算法研究[J];传感器与微系统;2012年04期
中国重要会议论文全文数据库 前10条
1 李燕苹;谢维信;杨烜;;复杂背景下基于多传感器图像融合的小目标检测[A];第十三届全国信号处理学术年会(CCSP-2007)论文集[C];2007年
2 牛继华;鲍长春;贾懋珅;;基于分形的帧擦除掩蔽方法[A];第十四届全国信号处理学术年会(CCSP-2009)论文集[C];2009年
3 刘亚;吴伟力;;基于关联维数的齿轮振动故障模式判别[A];2011航空试验测试技术学术交流会论文集[C];2010年
4 许鑫;苏开娜;胡起秀;;几种改进的MFCC特征提取方法在说话人识别中的应用[A];第一届建立和谐人机环境联合学术会议(HHME2005)论文集[C];2005年
5 李桂春;郑能恒;李霞;;基于模糊隶属值加权的MFCC特征提取算法[A];第七届和谐人机环境联合学术会议(HHME2011)论文集【poster】[C];2011年
6 杨露菁;郝威;李启元;;基于FMM神经网络与D-S证据理论的多传感器目标识别方法[A];2005中国控制与决策学术年会论文集(下)[C];2005年
7 蒋纯纲;屈百达;李金宝;王月;;基于小波变换后的分形理论的语音端点检测[A];2007中国控制与决策学术年会论文集[C];2007年
8 徐望;丁琦;王炳锡;;一种基于高维嵌入的词边界检测算法[A];中国声学学会2002年全国声学学术会议论文集[C];2002年
9 高原;景新幸;;基于线性与非线性特征组合的说话人识别系统研究[A];2006年声频工程学术交流会论文集[C];2006年
10 任华娟;景新幸;;用于说话人识别的FWMC特征参数提取[A];中国声学学会2009年青年学术会议[CYCA’09]论文集[C];2009年
中国博士学位论文全文数据库 前10条
1 于志明;无线通信系统中的信号识别技术研究[D];哈尔滨工程大学;2010年
2 杨锦园;基于传感器管理的移动机器人融合算法研究[D];华中科技大学;2010年
3 汪澎;驾驶人警觉状态检测技术研究[D];江苏大学;2010年
4 卜云;混沌时间序列自适应预测算法研究[D];电子科技大学;2010年
5 赵兆;相位编码雷达若干关键技术研究[D];南京理工大学;2010年
6 马健丽;信息系统安全功能符合性检验关键技术研究[D];北京邮电大学;2010年
7 吕钊;噪声环境下的语音识别算法研究[D];安徽大学;2011年
8 郑建炜;基于核方法的说话人辨认模型研究[D];浙江工业大学;2010年
9 王桓;电力时间序列的混沌识别与短期预测[D];湖南大学;2009年
10 王金林;基于混沌时间序列和SVM的入侵检测系统研究[D];天津大学;2010年
中国硕士学位论文全文数据库 前10条
1 赵林;雷达信号特征提取与识别[D];大连理工大学;2010年
2 袁铄;基于小波网络音频信号处理技术[D];大连理工大学;2010年
3 吴荣娣;基于特征分类直方图均衡的鲁棒性语音识别研究[D];苏州大学;2010年
4 童佳宁;基于HMM和PNN的混合语音识别模型研究[D];河北工程大学;2010年
5 王鹏;拓扑结构对Hindmarsh-Rose神经元放电模式调控作用的理论研究[D];安徽师范大学;2010年
6 姚建霄;基于STRAIGHT谱的语音识别算法研究[D];五邑大学;2010年
7 辜少鹏;汉语语言的物理特征提取及分析工具的研究与实现[D];东华大学;2011年
8 宋园方;基于Windows CE的说话人识别系统的设计与实现[D];西安电子科技大学;2009年
9 安秀红;基于特征参数的语音情感识别[D];太原理工大学;2011年
10 杜晓伟;嵌入式语音识别的研究与实现[D];北方工业大学;2011年
【同被引文献】
中国期刊全文数据库 前10条
1 欧阳缮,陈云宇,方惠均;一种改进的语音信号非线性自适应预测编码方案[J];电路与系统学报;1999年02期
2 杨海燕,杨斌,景新幸;说话人识别技术在智能家居中的应用[J];电声技术;2004年05期
3 韦岗,陆以勤,欧阳景正;混沌、分形理论与语音信号处理[J];电子学报;1996年01期
4 杨国海;夏清华;;无阻尼Duffing方程的多值共振解的稳定性研究[J];湖北大学学报(自然科学版);2008年01期
5 覃爱娜;黄仲;桂卫华;;基于混沌系统模型的非线性语音预测器[J];计算机工程与应用;2008年18期
6 林丽;周霆;余轮;;EMD算法中边界效应处理技术[J];计算机工程;2009年23期
7 白建东;叶德谦;李春兴;;混沌时间序列的Volterra级数多步预测研究[J];计算机仿真;2008年06期
8 陈艳锋;郑建华;吴新跃;王基;;无阻尼Duffing方程高精度近似解研究[J];机械科学与技术;2008年12期
9 王跃科,林嘉宇,黄芝平,沈振康;语音信号非线性分析与处理[J];通信技术;2000年01期
10 陈国,胡修林,张蕴玉,朱耀庭;基于短时分形维数的汉语语音自动分段技术研究[J];通信学报;2000年10期
中国博士学位论文全文数据库 前1条
1 侯建军;舰船摇荡混沌动力学分析及其时域预报研究[D];大连海事大学;2010年
中国硕士学位论文全文数据库 前8条
1 王泽杰;一种混合型个人身份认证系统设计与实现[D];浙江大学;2006年
2 龚英姬;基于HHT变换的病态嗓音特征提取及识别研究[D];广西师范大学;2007年
3 周昆湘;基于矢量量化的与文本无关的说话人确认系统的研究[D];中南大学;2007年
4 夏妍妍;基于RBF神经网络的语音识别方法的应用研究[D];大连海事大学;2008年
5 黄仲;基于混沌系统分析的非线性语音编码研究[D];中南大学;2008年
6 吴佩贤;基于微分进化免疫和聚类的RBF网络学习算法研究[D];苏州大学;2008年
7 何维军;基于分形、小波理论的碳纤维复合材料加工表面形貌研究[D];大连理工大学;2008年
8 王晨;基于非线性时间序列的胎儿心电信号分析与提取[D];北京工业大学;2009年
【二级引证文献】
中国期刊全文数据库 前2条
1 屠彬彬;于凤芹;;基于样本熵与MFCC融合的语音情感识别[J];计算机工程;2012年07期
2 汤丽平;刘剑;;基于近似熵的心肌猝死预警诊断[J];计算机工程;2012年09期
【二级参考文献】
中国期刊全文数据库 前10条
1 徐文盛,戴蓓倩,方绍武,李辉;基于连续HMM的孤立语音鲁棒性识别方法[J];电路与系统学报;1999年04期
2 李建东,李明远,纪红;话音活动检测的模型及其在移动通信中的应用[J];电信科学;1995年10期
3 李后强;分形理论在大分子科学及相关领域中的一些应用[J];大自然探索;1993年01期
4 俞一彪,袁保宗;连续语音识别中句法结构知识的利用[J];电子学报;1990年06期
5 裴留庆,顾勇;混沌与噪声[J];电子学报;1991年06期
6 韦岗,陆以勤,欧阳景正;混沌、分形理论与语音信号处理[J];电子学报;1996年01期
7 林嘉宇,黄芝平,王跃科,沈振康;语音信号相空间重构中嵌入维数的选择[J];电子科学学刊;1999年06期
8 潘震中;多传感器信息融合的谢弗-登普斯特方法[J];火力与指挥控制;1994年03期
9 陈国,胡修林,张蕴玉,朱耀庭;基于短时分形维数的汉语语音自动分段技术研究[J];通信学报;2000年10期
10 郝柏林;分岔、混沌、奇怪吸引子、湍流及其它——关于确定论系统中的内在随机性[J];物理学进展;1983年03期
中国重要会议论文全文数据库 前1条
1 黎建宁;王仁华;;矢量量化在说话人识别中的应用[A];第一届全国语言识别学术报告与展示会论文集[C];1990年
【相似文献】
中国期刊全文数据库 前10条
1 刘晋胜;;采用熵相关性优化分离性的SVM说话人识别[J];计算机工程与设计;2011年08期
2 刘金海;张化光;冯健;;输油管道压力时间序列混沌特性研究[J];物理学报;2008年11期
3 崔海霞;韦岗;;基于贝叶斯网络的博弈融合建模[J];传感器与微系统;2009年02期
4 刘东林,帅典勋,吴晓江;基于相空间重构的计算机网络的动力学特性分析[J];计算机工程与应用;2001年21期
5 侯丽敏;邓德春;王朔中;;利用语音非线性特征改进说话人识别的性能[J];模式识别与人工智能;2006年06期
6 张德干,郝先臣,高光来,赵海;一种新的用于分类挖掘的动态示例学习算法[J];通信学报;2002年02期
7 王润舵;;一种基于DBN信息融合的说话人识别方法[J];桂林电子科技大学学报;2010年06期
8 吴亚东,孙世新;低分辨率小规模网络流量数据的混沌特性鉴别[J];计算机应用研究;2005年09期
9 高岚,卢凌;混沌信号非线性特性的研究[J];武汉理工大学学报(交通科学与工程版);2002年05期
10 满峰泉;王忠林;;一组切换混沌系统的设计与电路实现[J];四川兵工学报;2009年12期
中国重要会议论文全文数据库 前10条
1 李玉阳;笪良龙;卢晓亭;;基于分维特征和小波包分析的舰艇目标分类方法研究[A];2005年全国水声学学术会议论文集[C];2005年
2 李桂春;郑能恒;李霞;;基于模糊隶属值加权的MFCC特征提取算法[A];第七届和谐人机环境联合学术会议(HHME2011)论文集【poster】[C];2011年
3 司罗;胡起秀;金琴;;完全无监督的双人对话中的说话人分隔[A];第九届全国信号处理学术年会(CCSP-99)论文集[C];1999年
4 丁烽;杜栓平;宫先仪;;目标辐射噪声的非线性特征分析[A];中国声学学会2001年青年学术会议[CYCA'01]论文集[C];2001年
5 侯丽敏;谢娟敏;;共振峰瞬时频率特征用于说话人识别[A];第九届中国语音学学术会议论文集[C];2010年
6 周昊朗;王岚;陈珂;;一个面向说话人识别的汉语语音数据库[A];第六届全国人机语音通讯学术会议论文集[C];2001年
7 周昊朗;王岚;吴玺宏;迟惠生;;一个面向说话人识别的汉语语音数据库[A];信号与信息处理技术——第一届信号与信息处理联合学术会议论文集[C];2002年
8 周静芳;陈一宁;刘润生;;一种新的说话人识别信道补偿技术[A];第七届全国人机语音通讯学术会议(NCMMSC7)论文集[C];2003年
9 吴志强;陈珂;迟惠生;;语音识别技术与说话人识别技术的结合——文本无关说话人识别的另一种方法[A];第四届全国人机语音通讯学术会议论文集[C];1996年
10 卓群;欧贵文;;基于模糊高斯混合模型的说话人识别算法的一些改进[A];第六届全国人机语音通讯学术会议论文集[C];2001年
中国重要报纸全文数据库 前10条
1 汪永安;科大讯飞说话人识别技术世界领先[N];安徽日报;2008年
2 吴长锋;科大讯飞勇夺说话人识别国际大赛第一[N];科技日报;2008年
3 周新红 田朝晖 段勇;信息融合:现代战争的重要支撑[N];解放军报;2005年
4 彭兴庭;“熵”与环境承载力[N];中国绿色时报;2004年
5 王朝选;科大讯飞语音识别技术取得重大进展[N];中国高新技术产业导报;2008年
6 见习记者 向南;科大讯飞语音识别技术国际领先[N];证券时报;2008年
7 赵辉 傅绍权;重视非线性特征的线性表现[N];中国国防报;2010年
8 许同和 徐德池;C4系统简介[N];解放军报;2005年
9 陶颖;玛雅文明消亡之谜新解[N];中国审计报;2004年
10 新城;小声音 大前景[N];计算机世界;2006年
中国博士学位论文全文数据库 前10条
1 侯丽敏;基于非线性理论和信息融合的说话人识别[D];上海大学;2005年
2 吴振锋;基于磨粒分析和信息融合的发动机磨损故障诊断技术研究[D];南京航空航天大学;2002年
3 朱大奇;航空电子设备故障诊断技术研究[D];南京航空航天大学;2002年
4 王承;基于神经网络的模拟电路故障诊断方法研究[D];电子科技大学;2005年
5 吴世雄;逆向工程中多传感器集成的智能化测量研究[D];浙江大学;2005年
6 袁成清;磨损过程中的磨粒表面和磨损表面特征及其相互关系研究[D];武汉理工大学;2005年
7 李立京;电梯综合测试系统与故障诊断技术的研究[D];天津大学;2002年
8 张小俊;基于嗅觉信息的机器人味源定位策略及实验研究[D];河北工业大学;2009年
9 张鹏飞;从一致双曲到一般的微分自映射[D];中国科学技术大学;2011年
10 卢山;基于非线性动力学的金融时间序列预测技术研究[D];东南大学;2006年
中国硕士学位论文全文数据库 前10条
1 陈妮;基于矢量量化和高斯混合模型的说话人识别技术研究[D];中南大学;2008年
2 许艳红;HHT变换在说话人识别中的应用[D];浙江大学;2005年
3 张伟伟;说话人识别技术的研究[D];燕山大学;2010年
4 李伟娟;基于智能群体和盲源分离的说话人识别[D];兰州理工大学;2010年
5 傅庚申;说话人识别算法研究[D];大连理工大学;2005年
6 王芳;说话人识别中一种特征参数的研究[D];安徽工业大学;2010年
7 潘鹏;会议室环境下基于音频视频信息融合的多说话人识别[D];兰州理工大学;2011年
8 杨延龙;与文本无关的说话人识别的关键技术研究[D];西安电子科技大学;2010年
9 徐良军;基于语音信号时变特性的说话人识别[D];苏州大学;2010年
10 陈文翔;面向OPHONE手机的说话人识别技术移植研究[D];浙江大学;2011年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026