唇读发声器中视觉信息的检测与处理
【摘要】:
为恢复那些后天致残、但仍然具有正确唇形特征语言残障者的语音表达能力,探索建立一个基于视觉信息的唇形识别发声系统,本研究把从嘴唇图像序列中提取的视觉信息作为一种特殊语言加以分析识别。在研究中,对视觉信息检测与处理中的一些基本问题,如视觉信息与语音信息的对应关系,嘴唇区域和唇形轮廓所包含的信息量,最佳唇读系统特征向量的选取,以及自动有效地提取与识别唇形特征的方法进行了深入分析。
论文的主要研究内容包括:
1.通过分析正面和侧面视角下人脸图像的特点,建立一种新的非对称唇形轮廓描述模型,其中既包含嘴唇高度、宽度等信息,又包含嘴唇突出度信息,同时计算各个参数对时间的导数,来获得唇形轮廓的动态信息,通过组合不同的特征参数,分析参数选择对识别效果的影响,基于独立汉字发音的实验表明,该模型能够将识别效果平均提高25%以上。并且据此模型设计建立了基于常用汉字、面向残疾人的汉语双模语音数据库。
2.基于运动检测和数学形态学方法对唇动序列的灰度图像进行处理,得到唇形区域和唇形轮廓,然后从唇形区域提取嘴唇宽度的投影W ,外唇轮廓的高度H ,嘴唇突出度的投影信息F ,并且考察它们对时间的导数关系,得到dW /dt , dH /dt , dF /dt等差分特征参数,组合形成6维几何特征向量。
3.利用离散傅里叶变换(DFT)和离散余弦变换(DCT)分别得到描述唇形轮廓特征的傅里叶描述子和离散余弦变换描述子,然后将两类描述子作为唇形轮廓的特征向量,采用隐马尔可夫模型(HMM)进行学习和识别,分析了两类描述子刻画唇形轮廓特征的能力。
4.采用特征融合技术提高特征向量分类识别能力,用串联加权组合的方法,将唇形区域几何特征向量和由离散余弦变换描述子表述的唇形轮廓特征向量融合形成新的特征向量,应用HMM对其进行学习和识别,分析不同加权因子下的识别效果。
5.选用二阶HMM来对唇形特征参数序列进行学习和识别,利用了各帧唇形特征向量之间的上下文相关性,更符合汉语发音方式,通过实验分析比较了一阶HMM和二阶HMM对相同特征向量的识别能力。
|
|
|
|
1 |
王珏;张锋;张健保;徐进;李延海;陈龙伟;陈艳妮;;《康复工程》精品课程建设之思考[A];第七届全国康复医学工程与康复工程学术研讨会论文集[C];2010年 |
2 |
赵展;喻洪流;;康复工程专业实验教学模式探索[A];第七届全国康复医学工程与康复工程学术研讨会论文集[C];2010年 |
3 |
喻洪流;;国内外康复工程教育发展状况[A];中国康复医学会康复治疗专业委员会康复辅助器具学组成立暨全国康复辅助器具学术研讨会论文汇编[C];2011年 |
4 |
孙元;张育成;;康复工程的科—工—贸结合问题[A];中国康复医学会第四届会员代表大会暨第三届中国康复医学学术大会论文汇编[C];2001年 |
5 |
胡天培;;康复工程在上海交通大学[A];中国康复医学会第四届会员代表大会暨第三届中国康复医学学术大会论文汇编[C];2001年 |
6 |
金德闻;季林红;张济川;;康复工程研究的新进展[A];中国康复医学会第四届会员代表大会暨第三届中国康复医学学术大会论文汇编[C];2001年 |
7 |
张济川;金德闻;;康复工程20年发展历程的回顾与展望[A];继往开来 与时俱进——2003年康复医学发展论坛暨庆祝中国康复医学会成立20周年学术大会论文集[C];2003年 |
8 |
Seelman Katherine D;Brienza David M;王珏;;美国康复工程发展与动态[A];中国康复医学会第四届会员代表大会暨第三届中国康复医学学术大会论文汇编[C];2001年 |
9 |
金德闻;张济川;;康复工程中生物机械学研究及应用[A];第七届全国康复医学工程与康复工程学术研讨会论文集[C];2010年 |
10 |
张济川;金德闻;;康复工程在现代康复医学中的作用及其进展[A];第六次全国运动疗法学术会议论文集[C];2002年 |
|