收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

唇读应用中唇部信息的定位跟踪与特征提取技术研究

杨阳  
【摘要】: 在计算机科学与信息技术发展进步的过程当中,人们一直努力研究如何通过使用各种不同方式,来完善人机交互的方式与手段。能够让机器准确而且快捷的理解使用者的意图,长期以来都是众多相关领域学者不懈努力的目标。近些年来,唇读技术作为符合人类多模态交流方式的手段之一,吸引了越来越多的学者关注。该技术的潜在应用已经从最初的与音频信息融合,以提升提高现有语音识别系统的识别率,逐步扩展到了身份认证、辅助教育等等领域当中。 唇读系统的构建主要包含视频数字图像的对象检测、特征提取和识别处理这三个方面的工作。本文介绍了构建识别系统的流程。说明了隐马尔科夫模型(HMM)的算法思想以及利用其构建唇读识别系统的主要原理。实现了一个用于实验研究的原型系统。其中,对于其在不同环节所涉及的技术问题的多种解决方法进行了介绍与比较。 首先,对于视频图像中的人脸嘴唇部分的检测,对文中所使用的级联分类器的算法进行了分析讲解。这里使用OpenCV实现了嘴唇部分的检测与跟踪。然后,介绍分析了目前应用于该研究领域中的几类具有代表性的特征提取技术,文中选择了基于像素的方法并加以实现。并对于其中所使用的算法公式进行了详细的描述。最后,基于HMM原理实现了识别模块的功能,完成整个原型系统。 作为在该研究领域的尝试与探索,本文完成了一定的数据采集分析和处理的基础工作。在完成系统主要功能的同时,分析了目前若干环节的算法性能与模型的不足。为下一步的研究工作提出了设想与展望。


知网文化
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978