收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

汉藏双语跨语言语音转换方法的研究

王振文  
【摘要】:近年来,随着人机语音交互技术的迅速发展,语音转换技术已经得到众多研究学者的重视,将被应用到教育、通信等诸多领域。在国内,对汉语普通话、广东话等主流语言的语音转换方法的研究已经取得很大的进步。但目前还缺少民族语言与方言的跨语言语音转换系统。藏族是我国古老的少数民族之一,藏语的使用人数众多,分布区域广泛。本文将藏语拉萨话作为研究对象,建立了2800句藏语拉萨话的语料库,切分及标注声韵母信息并建立了藏语的声韵母库。在进行汉藏双语跨语言语音转换时,首先是把待转换的藏语文本翻译得到对应的汉语文本,将汉语文本进行文本分析获得所有的声韵母,再查找已建立好目录索引的声韵母库;以藏语的声韵母为基元,同时利用边界信息,根据语境有关的问题集与候选基元的频谱距离进行决策树的建立。对于目标汉语语句,利用决策树算法选择最符合语境信息的声韵母,选取发该音位置和音质最符合的声韵母,然后分别利用波形拼接合成法和STRAIGHT算法得到对应的汉语语音语句,从而完成汉藏双语跨语言语音转换方法的研究。论文的主要工作和创新如下:1、建立了2800句藏语拉萨话的语料库,提取并建立了藏语的声韵母库。首先进行藏语文本语料的设计,然后进行语音语料的录制,再进行切分及标注得到所有声韵母的信息,最后按照藏语的声韵母进行归类,建立目录索引。从而完成藏语声韵母库的建立,为汉藏双语跨语言语音转换奠定了基础。2、汉藏双语跨语言语音转换中采用了STRAIGHT算法。它可以很灵活地修改语音信号的基频、非周期索引和平滑时频谱等相关参数,从而提高转换目标语音的音质。3、实现了汉藏双语跨语言语音转换。对于待转换成的目标汉语语句,利用决策树算法选择最符合语境信息的声韵母,选取发该音位置和音质最合适的声韵母,然后分别利用波形拼接合成法和STRAIGHT算法得到对应的汉语语音语句,并对转换后语音进行了MOS评测、DMOS评测和ABX测试。实验结果表明,使用STRAIGHT算法转换得到语音的音质要优于使用波形拼接合成法。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 谢贵武;杨继红;肖勇;闵刚;;基于语音分段的自适应时长调整算法[J];军事通信技术;2008年02期
2 樊建中;孙晴;杨永杰;;一种智能盲文学习机设计[J];现代电子技术;2010年05期
3 温洪昌;黄应强;傅贵兴;;单片机的多段语音组合录放系统设计[J];单片机与嵌入式系统应用;2011年10期
4 张剑;袁华强;;Rhetorical-State SVM在抽取式语音摘要中的应用[J];科学技术与工程;2013年21期
5 卢坚 ,毛兵 ,孙正兴 ,张福炎;一种改进的基于说话者的语音分割算法[J];软件学报;2002年02期
6 章文义,朱杰;几种无语音检测噪音估计方法的比较研究[J];计算机工程与设计;2003年10期
7 林鑫;陈桦;王开志;王继成;;语音驱动唇形自动合成算法[J];计算机工程;2007年17期
8 蔡铁;;基于在线单类支持向量机的自适应语音活动检测[J];深圳信息职业技术学院学报;2008年02期
9 章钊;郭武;;话者识别中结合模型和能量的语音激活检测算法[J];小型微型计算机系统;2010年09期
10 朱淑琴,裘雪红;一种精确检测语音端点的方法[J];计算机仿真;2005年03期
11 李艳雄;贺前华;陈楠;齐朝晖;;基于谱稳定性特征的语音与笑声区分新方法[J];电子与信息学报;2008年06期
12 高福友;陈雁翔;;一种基于说话者的无监督语音分割算法[J];合肥工业大学学报(自然科学版);2010年05期
13 Takao ,刘吉峰;语音接口[J];今日电子;1996年Z1期
14 祝庆绩,钱国荣,李治柱;面向移动电话应用的粤语语音数据库构建[J];计算机应用与软件;2004年07期
15 刘娟花;李福德;;一种改进的小波域语音去噪方法研究[J];西安工程科技学院学报;2006年01期
16 陈功;张雄伟;;一种基于灰关联分析的语音/音乐分类方法[J];声学技术;2007年02期
17 杨茂巍;郑伯川;高春梅;;基于SAPI的语音驱动口型动画方法[J];现代计算机(专业版);2012年10期
18 张振国,王晓霞;神经网络在语音音调识别中的应用研究[J];微电子学与计算机;2005年03期
19 张江安,杨洪柏,林良明,颜国正;一种基于段间距离测度的语音自动分割方法[J];上海交通大学学报;2001年09期
20 张俊星;刘宇;;基于二级搜索模型的有声出版物语音分割算法[J];吉林大学学报(工学版);2009年S2期
中国重要会议论文全文数据库 前9条
1 田野;王作英;陆大金;;基于韵律结构信息的非语音拒识[A];第六届全国人机语音通讯学术会议论文集[C];2001年
2 徐明;胡瑞敏;黄云森;;基于音素识别的语音评价方法[A];第二届和谐人机环境联合学术会议(HHME2006)——第15届中国多媒体学术会议(NCMT'06)论文集[C];2006年
3 王欢良;韩纪庆;李海峰;王承发;;面向嵌入式应用的小词汇量语音串识别系统[A];第七届全国人机语音通讯学术会议(NCMMSC7)论文集[C];2003年
4 那斯尔江·吐尔逊;吾守尔·斯拉木;麦麦提艾力;;维吾尔语大词汇量连续语音识别研究——语音语料库的建立[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年
5 简志华;王向文;;考虑帧间信息的语音转换算法[A];浙江省信号处理学会2012学术年会论文集[C];2012年
6 魏维;马海燕;;一种丢失语音信包重建的新算法[A];通信理论与信号处理新进展——2005年通信理论与信号处理年会论文集[C];2005年
7 陈凡;罗四维;;一个实用语音开发应用系统的设计与实现[A];第二届全国人机语音通讯学术会议论文集[C];1992年
8 刘红星;戴蓓蒨;陆伟;;基于图像增强方法的共振峰谐波能量参数的语音和端点检测[A];第九届全国人机语音通讯学术会议论文集[C];2007年
9 林爱华;张文俊;王毅敏;;基于肌肉模型的语音驱动唇形动画[A];第十三届全国图象图形学学术会议论文集[C];2006年
中国博士学位论文全文数据库 前10条
1 高伟勋;智能家居环境中个性化语音生成关键技术研究[D];东华大学;2015年
2 陈丽萍;说话人确认中语音段差异建模相关问题的研究[D];中国科学技术大学;2016年
3 陶冶;文本语音匹配的研究和应用[D];山东大学;2009年
4 何俊;声纹身份识别中非常态语音应对方法研究[D];华南理工大学;2012年
5 李冬冬;基于拓展和聚类的情感鲁棒说话人识别研究[D];浙江大学;2008年
6 双志伟;个性化语音生成研究[D];中国科学技术大学;2011年
7 古今;语音感知认证的关键技术研究[D];中国科学技术大学;2009年
8 彭波;Internet上语音的鲁棒性传输研究[D];华南理工大学;2001年
9 黄湘松;基于混淆网络的汉语语音检索技术研究[D];哈尔滨工程大学;2010年
10 应娜;基于正弦语音模型的低比特率宽带语音编码算法的研究[D];吉林大学;2006年
中国硕士学位论文全文数据库 前10条
1 王明明;基于GMM和码本映射相结合的语音转换方法研究[D];西安建筑科技大学;2015年
2 印雪晨;宋词朗读呼吸信号和韵律时长研究[D];西北民族大学;2015年
3 邱一良;噪声环境下的语音检测方法研究[D];电子科技大学;2015年
4 朱俊梅;基于性别预分类的年龄自动估计研究[D];江苏师范大学;2014年
5 张占松;基于DSP的语音干扰方法研究与实现[D];北京交通大学;2016年
6 李鹏;基于系统融合的语音查询项检索技术研究[D];解放军信息工程大学;2015年
7 赵蓉蓉;基于计算听觉场景分析的单通道语音盲分离技术[D];太原理工大学;2016年
8 崔瑞莲;语种识别中的语音段表示方法研究[D];中国科学技术大学;2016年
9 刘学;基于语音样例查询的关键词识别方法研究[D];中国科学技术大学;2016年
10 王振文;汉藏双语跨语言语音转换方法的研究[D];西北师范大学;2015年
中国重要报纸全文数据库 前5条
1 atvoc;数码语音电路产品概述[N];电子资讯时报;2008年
2 记者 李山;德用双音素改进人工语音表达[N];科技日报;2012年
3 中国科学院自动化研究所模式识别国家重点实验室 于剑陶建华;个性化语音生成技术面面观[N];计算机世界;2007年
4 江西 林慧勇;语音合成芯片MSM6295及其应用[N];电子报;2006年
5 ;与“小超人”对话[N];中国计算机报;2001年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978