收藏本站
《合肥工业大学》 2001年
收藏 | 手机打开
二维码
手机客户端打开本文

基于音节的汉语连续语音声调识别方法研究

钟金宏  
【摘要】: 声调是汉语的主要属性之一,具有构词、辨义和提高表达效果等功能,对语 音识别、语音合成和自然语言理解有重要意义。 近年来,自动语音识别研究取得了突破性的进展,出现了许多不同类型的语 音识别系统。语音识别研究也转向了大词汇非认人连续语音识别和自然语言理解。 现有的汉语语音识别系统基本上没有利用声调信息,声调识别研究也多限于孤立 字和多字词的声调识别,连续语音的声调模式和声调识别研究很少,本文在这方 面开展了一点工作。 汉语连续语音的声调识别比孤立字和多字词的声调识别更困难,本文提出了 基于音节的声调识别思想,研究了其中涉及的音节分割、声调获取、特征提取、 声调模式分析和声调识别模型等问题。论文的主要内容如下: (1)利用分形理论和波形互相关性研究了汉语连续语音中的音节分割问题。 本文选音节做声调识别基元,这将引入音节切分问题。连续语流中的音节分割是 非常困难的。本文根据语音信号的混沌本质,利用分形理论研究了汉语连续语音 中的音节分割问题,提出了基于方差分形维数的音节分割方法,并详细分析了该 方法的性能,它能很好地解决了无声与有声、浊音与清音间的分割问题,但很难 解决浊音间的分割问题,当浊音相连且过渡段较短时,该方法无法实现它们之间 的分割。为解决浊音之间的分割问题,本文根据语音中过渡段与非过渡段语音波 形的差异,利用波形互相关性进行了研究,提出了基于波形互相关性的音节分割 方法,并进行了实例分析。 (2)基于小波变换的语音基频提取。声调是基频变化的模式,因此可通过基 频提取来获取声调信息。基频提取的方法很多,本文采用了小波变换方法,该方 法对部分语音得到了较好的结果,但对大部分语音提取的基频中含有较多错误, 经仔细分析和研究,本文对它进行了改进,提出了一种基于小波变换的语音基频 检测新算法。该算法根据基频点在小波变换的不同分辨率层具有传递性和在不同 尺度上的基频点位置相似的特性,采用投票策略选择基频点。该算法主要有以下 几步:计算在五个(或三个)尺度上的小波变换;运用投票机制进行基频点选择; 基频检查;基频点的重新定位。 (3)声调识别中的特征提取问题。特征提取是模式识别的基本问题。有效的 特征既能反映模式的重要信息,又可减少计算量和误识率。汉语声调主要由基音 曲线的调位高低和走向决定。因此,本文选择头尾差和相对调位比作为三字词音 节的声调特征;选择头尾差和音节起点调位作为连续语音中音节的声调特征。 合肥工业大学搏土论文 扬耍 (4)声调模式分析。连续语音中各音节的声调特征受前后音节的影响变化较 大,声调模式更加复杂,仅具有四声的基本特征。正确地分析其中的声调模式和 变调规则,对汉语连续语音的声调识别有重要意义。本文介绍了孤立字和二字词 的声调模式,定性和定量地分析了三字词的声调模式,在此基础上研究了连续语 音的声调模式。 (5)声调识别模型的选择与设计。汉语连续语音的声调模式复杂多变,一个 固定不变的识别模型不可能解决连续语音的声调识别问题。本文以具有在线学习 能力的模糊神经网络作为声调识别模型,提出了基于模糊自适应谐振理论映射的 声调识别方法。 (6)用三字词和连续语音实例验证了所提出的思想和方法。 论文中取得的研究成果如下: 门)根据汉语的特点,提出了基于音节的汉语连续语音声调识别思想。 (2)根据语音信号的混饨本质,提出了基于方差分形维数的音节分割方法;针对 浊音间的分割困难,提出了基于波形互相关性的音节分割方法。 (3)根据传统小波变换方法在基频检测实验中出现的问题,引入投票策略,提出 了一种基于小波变换的基频检测新算法。 (4)根据汉语声调曲线的特点,选择头尾差和相对调位比作为三字词各音节的声 调特征:选择头尾差和音节起点调位作为连续语音中音节的声调特征。 (5)定性和定量地分析了三字词的声调模式,印证了已有的三字词声调模式变化 规律,得到了一些新的三字词声调模式变调规则。对汉语连续语音的声调模 式,提出了以下观点:连续语音中的音节声调模式可以二字词和三字词的声 调模式为基础:连续语音中的音节可认为仅受前后音节的彤响,一定间隙前 后的音节声调可看成互不相关;连续语音中的音节声调模式可归为头、中和 尾三类,通过对这三类声调模式的建模,可解决连续语音的声调识别问题。 ①)为了适应连续语音中的复杂情况,提出了以具有在线学习能力的模糊神经网 络作为声调识别模型的观点。在此基础上提出了基于模糊自适应谐振理论映 射的声调识别方法。
【学位授予单位】:

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 张永锋;杨影;肖莹莹;;基于主成分分析的汉语连续语音切分算法[J];应用声学;2011年05期
2 曹阳,黄泰翼,徐波;基于统计方法的汉语连续语音中声调模式的研究[J];自动化学报;2004年02期
3 翁素贞,贾宇清;连续语音串识别显示系统的研究与应用[J];城市轨道交通研究;2005年02期
4 王艳;冯宏伟;张利平;忽满利;;基于元音检测的汉语连续语音声韵母分割[J];计算机工程与应用;2011年14期
5 沈彩凤;俞一彪;;一种新的汉语连续语音声调评测算法[J];声学技术;2013年04期
6 刘家康,柯有安,林茂庸;采样率可变的连续语音采集系统的设计[J];数据采集与处理;1991年01期
7 尹明明;李弼程;屈丹;牛铜;;连续语音解码阈值参数的优化[J];模式识别与人工智能;2012年01期
8 贺前华;何俊;李艳雄;王志峰;;基于相关维数的病变连续语音检测算法[J];华南理工大学学报(自然科学版);2012年06期
9 龚一凡;;汉语连续语音理解系统[J];东南大学学报;1990年04期
10 张劲松,戴蓓倩;基于知识和模糊决策的连续语音的约束匹配[J];中国科学技术大学学报;1993年02期
11 林莉莉;;基于能量包络的连续语音分段方法[J];数字技术与应用;2013年09期
12 王勇;张连海;;基于点过程模型连续语音关键词检测[J];太赫兹科学与电子信息学报;2013年06期
13 刘葳;孙一鸣;;一种改进的连续语音特征提取算法[J];长春理工大学学报(自然科学版);2014年01期
14 钟金宏,杨善林,蒋俊杰;汉语连续语音中声调识别的特殊性研究[J];小型微型计算机系统;2002年04期
15 阙大顺;李星星;胡慧玲;;基于分形维的连续语音实时分割技术[J];电讯技术;2008年11期
16 李永宏;于洪志;孔江平;;藏语连续语音语料库设计与实现[J];计算机工程与应用;2010年13期
17 陆俊;杨俊安;王一;;改进的基于点过程模型的连续语音关键词识别技术[J];电路与系统学报;2013年02期
18 倪崇嘉;刘文举;徐波;;基于多空间概率分布的汉语连续语音声调识别研究[J];计算机科学;2011年09期
19 魏瑞莹;梁维谦;;基于三音子模型连续语音声调识别方法[J];电声技术;2011年08期
20 木合塔尔·沙地克;布合力齐姑丽·瓦斯力;李晓;;基于维吾尔语单词清、浊音组成结构特征的连续语音单词切分算法[J];西北师范大学学报(自然科学版);2013年04期
中国重要会议论文全文数据库 前8条
1 曹阳;黄泰翼;;基于统计方法的汉语连续语音中声调模式的研究[A];第九届全国信号处理学术年会(CCSP-99)论文集[C];1999年
2 程兰颖;俞铁城;李忠香;;基于音节分割的连续语音多模板隐马尔可夫模型的研究[A];第三届全国人机语音通讯学术会议论文集[C];1994年
3 孙海;范京;刘惠华;;汉语连续语音中的单字起止点综合判别的新方法[A];第十届全国信号处理学术年会(CCSP-2001)论文集[C];2001年
4 吴及;许海天;王作英;;连续数字串识别中语速的在线自适应方法[A];第六届全国人机语音通讯学术会议论文集[C];2001年
5 沈彩凤;俞一彪;;采用三音节FO插值的连续语音声调评测算法[A];2011'中国西部声学学术交流会论文集[C];2011年
6 肖熙;王作英;;汉语连续语音声调识别的HMM方法[A];第五届全国人机语音通讯学术会议论文集[C];1998年
7 曹阳;黄泰翼;;基于小波变换的基频提取和连续语音中基频变化模式的分析[A];第四届全国人机语音通讯学术会议论文集[C];1996年
8 朱思俞;石锋;;不定人连续汉语音的四声识别[A];第二届全国人机语音通讯学术会议论文集[C];1992年
中国博士学位论文全文数据库 前1条
1 钟金宏;基于音节的汉语连续语音声调识别方法研究[D];合肥工业大学;2001年
中国硕士学位论文全文数据库 前8条
1 范佳露;3-5岁听障儿童连续语音重复能力的特征及干预研究[D];华东师范大学;2010年
2 张芳;听障与健听儿童连续语音切换能力的比较及应用研究[D];华东师范大学;2009年
3 韩虎;汉语连续语音的音节自动标注算法研究及实现[D];哈尔滨工业大学;2008年
4 袁浩;连续语音中关键词快速检出的研究[D];哈尔滨工业大学;2011年
5 何义华;基于飞行器的连续语音指令识别技术研究[D];南京航空航天大学;2008年
6 陈斌;汉语连续语音声韵母类别属性检测技术研究[D];解放军信息工程大学;2011年
7 严欢;汉语连续语音声调及数字串识别系统的研究[D];哈尔滨理工大学;2011年
8 施凝;中等词汇量的汉语连续语音关键词识别系统[D];同济大学;2006年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978