文本-可视语音合成系统的研究及实现
【摘要】:文本-可视语音合成系统,将语音和图像两种模态结合到一起,建立了多模式人机交互接口,大大改善了人机交互的方式,在许多领域有着广泛的应用前景。为了生成具有较强真实感的,能应用于网络、嵌入式等环境的TTVS 系统,本文工作如下:
本文首先建立了一个二维标准人脸模型,并应用MPEG-4 人脸动画原理开发了二维人脸动画数据编辑工具,在此基础上建立以FAP 为驱动源的基于标准人脸的动画机制。通过改进的主动形状模型方法,开发了基于单张人脸图片的人脸模型匹配工具,从而建立了适用于任意人脸的动画机制。提出动态音节视位的概念,将文本映射为相应的音节视位。在音节视位的拼接过程中,先根据语音韵律规则对音节视位进行调整,然后根据用户指定的表情进行表情与视位融合,最后应用改进的Hermite 插值算法对音节视位进行拼接,从而合成了富有表情具有语音韵律感的人脸动画。借助科大讯飞文语合成系统,实现了语音与动画同步机制,实现了一个文本驱动的人脸语音动画系统。在原有聊天系统的基础上增加TTVS 功能,实现了一个网络语音动画聊天系统。
与以往不同,本文开发的TTVS 系统数据量小,能够实时生成,动画机制具有模型移植性,具有表情和语音韵律感,更具有真实感,能够适用于网络与嵌入式环境。
本课题受国家自然科学基金项目“虚拟人多模式行为协同关系学习算法的研究”资助。
|
|
|
|
1 |
胡剑凌,徐盛,陈健;MPEG-4多媒体通信音频编码[J];计算机工程;2000年07期 |
2 |
樊振萍,唐继勇;基于RTP协议和MPEG-4的流媒体系统分析与实现[J];西部广播电视;2004年10期 |
3 |
鄢强,朱维乐;基于Nexperia PNX1300的MPEG-4实时远程视频监控系统[J];中国有线电视;2004年Z3期 |
4 |
陈军民;MPEG-4与PEZW信号编码算法[J];黑龙江通信技术;1998年04期 |
5 |
卢官明;MPEG-4中的Profiles及适用场合[J];南京邮电学院学报(自然科学版);2000年04期 |
6 |
;Sun与飞利浦公司为无线和宽带市场开发MPEG-4解决方案[J];电信技术;2001年11期 |
7 |
;MPEG-4中国汉唐叫板美国微软[J];软件工程师;2001年08期 |
8 |
许先斌,余韦,贾颖,孙立涛;基于RTP包本地丢失恢复的MPEG-4多播应用模型[J];计算机工程与设计;2005年04期 |
9 |
;夏普参考出品MPEG-4录像机[J];电视技术;2000年11期 |
10 |
石旭利,张兆扬;小波变换和算术编码在MPEG-4中的应用[J];电视技术;2001年05期 |
11 |
朱小松,余英林;MPEG-4编、解码器容错技术的研究[J];电视技术;2003年05期 |
12 |
杨辉媛;浅析视频压缩国际标准及MPEG—4主要技术[J];电脑知识与技术;2004年26期 |
13 |
周晓光,王艳春;MPEG-4视频标准及其关键算法[J];信息技术;2004年09期 |
14 |
李庆萍,石中锁,陈明;MPEG-4在视频监控应用中的软件实现[J];微计算机信息;2004年12期 |
15 |
骆华;MPEG-4通用音频编码技术及解码器实现[J];现代计算机;2005年01期 |
16 |
唐瑞英,李华;MPEG-4视频对象分割技术[J];信号处理;2005年03期 |
17 |
杨群星,肖自美,郑伟国,刘红梅;多媒体通信的未来之路——MPEG-4与多媒体通信[J];今日电子;1997年04期 |
18 |
;数码视讯应用MPEG-4技术致力于基于DSP硬件系统的研制[J];广播电视信息;2003年01期 |
19 |
李安明,贺德华;基于Internet的MPEG-4视频流传输系统[J];现代计算机;2004年01期 |
20 |
闵文凯;基于对象和内容的视频编码技术—MPEG-4[J];中国有线电视;2004年18期 |
|