收藏本站
《沈阳工业大学》 2005年
收藏 | 手机打开
二维码
手机客户端打开本文

基于SAPI引擎的语音交互方法的研究与实现

任振刚  
【摘要】:语音交互以语音识别和语音和成为基础,语音识别是将音频信息转换成文本或者其它形式的计算机能够处理的信息的技术。语音合成是将文本文件转换成语音信息。经过国内外多年的研究探索,出现了许多语音识别的方法,其中比较成功的并具代表性的有模式匹配法;统计概率模型的识别方法(其主要代表是隐马尔可夫模型);人工神经网络方法。其中隐马尔可夫模型成为大词汇量连续语音识别的主导方法。 本文从语音识别系统的系统框架出发,重点探讨研究了基于隐马尔可夫模型的语音识别的实现方法。包括语音声学分析(预处理,特征提取等),声学HMM模型的建立和识别过程。重点讨论声学HMM模型的基本建模方法以及模型参数的训练重估方法。 语音是最符合人类自然习惯的一种通信交互方式。随着语音交互技术的发展,它在人机接口和多媒体方面的应用也越来越普遍了。在计算机的运算速度和存储能力迅速提高之后,输入输出的人机界面变得越来越重要,人机接口是当前计算机领域的热门课题之一。而语言是人类用来交流最自然、最有效的手段,也是众多载体中具有最大信息量的信号,具有最高的智能水平。一旦计算机具备了这种语言功能,其智能程度与应用价值将大大增加。因为在这种人机交互中使用的是最自然的语言方式来存储和处理信息,是人机交互的一次革命。总之语音识别技术将给人们带来一个轻松的接口方式,它同其它技术的结合还可以构成专门的应用,比如全自动电话系统,同声会议翻译系统,智能多媒体语言教学系统等。其中具有代表性的是Microsoft公司推出MS-Agent。 本文在对基于隐马尔可夫模型的语音识别技术进行了分析研究之后,应用MS-Agent设计出了语音识别系统与用户进行语言交流的人机接口。把该语音交互分成两个部分,一个是语音输入,即“听”的功能,一个是语音输出,即“说”的功能。实现这两个功能的分别是语音输入识别引擎和MS-Agent的文本朗读Text-To-Speech引擎。这两个引擎使MS-Agent有了语音按钮,使MS-Agent能回答复杂的对话、记录声音和文本。正是MS-Agent能听会说会唱,使MS-Agent在PC机上实现了强大的人机交互的功能。
【学位授予单位】:沈阳工业大学
【学位级别】:硕士
【学位授予年份】:2005
【分类号】:TN912.3

手机知网App
【引证文献】
中国硕士学位论文全文数据库 前6条
1 卓佳;基于激励学习的人机口语对话策略优化[D];长沙理工大学;2006年
2 舒雷;移动设备交互式应答系统研究[D];江西财经大学;2006年
3 窦则欣;基于SAPI引擎的文本编辑工具中语音命令的应用研究[D];沈阳工业大学;2007年
4 孙望;语音识别技术的研究及其在发音错误识别系统中的应用[D];南京航空航天大学;2008年
5 张宗涛;工程机械行驶驱动系统半物理仿真平台设计[D];长安大学;2009年
6 凌代红;基于MS Agent和TTS的剧本引擎的设计与应用[D];浙江工业大学;2012年
【参考文献】
中国期刊全文数据库 前9条
1 江铭虎,朱小燕,袁保宗;语音识别与理解的研究进展[J];电路与系统学报;1999年02期
2 金红,史志杰,吴文虎;话语系统现状与研究方向[J];多媒体世界;1996年05期
3 赵建民,朱信忠;基于Agent的Visual Basic人性化软件编程技术[J];计算机工程与应用;2003年06期
4 周立柱;赵洪彪;;Agent行为及其新的服务方式[J];计算机科学;1999年03期
5 胡华,俞宏知;面向软件体系结构和Agent联邦的软件系统合成[J];计算机工程;2001年09期
6 徐丽,韩晓刚,王怀民;智能Agent技术在因特网上的应用[J];计算机工程与科学;1999年01期
7 聂敏;语音识别及其关键技术[J];微波与卫星通信;1999年04期
8 张寅生,唐跃平;智能Agent与Agent系统[J];计算机系统应用;1998年07期
9 傅晓,林道发,杨家沅;全音节连续汉语语音识别的研究[J];信号处理;1994年03期
【共引文献】
中国期刊全文数据库 前10条
1 胡钢,沈文轩;一种基于噪声动态检测的语音端点检测算法[J];鞍山科技大学学报;2004年02期
2 冯成林,吴淑珍;一种噪声环境下的语音识别方法(线性预测误差法)的研究[J];北京大学学报(自然科学版);2000年05期
3 黄新宇,吴淑珍;基于单边自相关线性预测噪声中汉语语音识别[J];北京大学学报(自然科学版);2000年05期
4 王炜,刘峰,吴淑珍;RASTA滤波在语音通信质量客观评价中应用的研究[J];北京大学学报(自然科学版);2003年05期
5 高友福;;语音的线性预测分析原理与算法[J];长江工程职业技术学院学报;2006年04期
6 黄萃;陈永生;;基于Agent的数字档案个性化服务体系研究[J];档案学通讯;2006年05期
7 柳洲;王少荣;;基于FPGA和光纤通信的音频传输系统设计[J];电气应用;2007年08期
8 白顺先;马瑞士;;语音端点检测中判决机制的研究[J];大连民族学院学报;2010年03期
9 魏晓聪;路莹;唐晓君;李鑫;;对多声道音频文件的基于旋律的音频检索系统设计[J];大连工业大学学报;2008年03期
10 周丹;高建勋;;基于多Agent的遥视与EMS系统的结合应用[J];电力系统通信;2008年01期
中国重要会议论文全文数据库 前7条
1 邓立新;杨震;郑宝玉;;一种判别语音静、清、浊三态的新方法[A];第九届全国信号处理学术年会(CCSP-99)论文集[C];1999年
2 陆飞;何文秀;徐春燕;;基于自相关夹角法的语音识别算法研究[A];2009中国控制与决策会议论文集(2)[C];2009年
3 淡艳;康弘俊;;基于声纹识别的身份认证技术[A];2007’促进西部发展声学学术交流会论文集[C];2007年
4 罗林;何培宇;潘帆;;一种利用门限值实现耳鸣匹配声源多样化的新方法[A];全国第五届信号和智能信息处理与应用学术会议专刊(第一册)[C];2011年
5 程恩;黄劲;黄联芬;;语音识别与合成技术在水下语音传输中的应用[A];现代通信理论与信号处理进展——2003年通信理论与信号处理年会论文集[C];2003年
6 葛余博;谢新艳;葛菱南;杨楠;胡波;;计算机语音识别的新参数[A];第六届全国人机语音通讯学术会议论文集[C];2001年
7 张会清;于洪珍;王正友;;语音识别及神经网络的应用[A];2001年中国智能自动化会议论文集(上册)[C];2001年
中国博士学位论文全文数据库 前10条
1 洪弘;基于Hilbert-Huang变换的汉语动态特征分析[D];南京大学;2010年
2 黄丽霞;非特定人鲁棒性语音识别中前端滤波器的研究[D];太原理工大学;2011年
3 刘纪平;多重演化神经网络在语音识别中的应用[D];武汉大学;2011年
4 赵慧;分布网络管理体系结构的研究[D];西安电子科技大学;1999年
5 张智雄;Internet科技信息资源门户网站(STIP)系统的实践研究[D];中国科学院文献情报中心;2000年
6 钱志勤;人机交互的演化设计方法及其在航天器舱布局方案设计中的应用[D];大连理工大学;2001年
7 王强;基于混沌与分形理论的炉管泄漏检测与诊断系统的研究[D];华北电力大学(河北);2003年
8 覃胜;语言学习系统学生终端机的数字化研究[D];重庆大学;2004年
9 刘大健;模糊模式识别在模拟驾驶系统中的应用研究[D];浙江大学;2005年
10 李波;语音转换的关键技术研究[D];国防科学技术大学;2005年
中国硕士学位论文全文数据库 前10条
1 徐雯;VDR音频数据数字水印算法研究[D];哈尔滨工程大学;2010年
2 银兵;基于μ’nSP~(TM)处理器的嵌入式语音控制技术研究[D];河南理工大学;2010年
3 杨成;嵌入式平台语音识别系统及优化研究[D];华南理工大学;2010年
4 双丹;基于仿生模式识别的汉语语音声调识别方法的研究[D];华东理工大学;2011年
5 赵明;基于经验模态分解的语音端点检测算法研究[D];安徽大学;2010年
6 王国文;语音密码机中的语音压缩改进算法研究[D];西安电子科技大学;2011年
7 史宝虹;基于多层架构模型设计的呼叫中心设计及实现[D];西安电子科技大学;2008年
8 周雯;声音内容特征控制的动画自动生成系统研究[D];山东师范大学;2011年
9 辛宪阳;基于多模态融合的足球视频语义分析[D];吉林大学;2011年
10 吴怡;基于LMS算法的语音增强系统的研究[D];北京邮电大学;2011年
【同被引文献】
中国期刊全文数据库 前10条
1 刘秀;用Matlab实现硬件端口采集的方法[J];兵工自动化;2003年03期
2 顾宗磊;尹玉亮;;MS-Agent在双语教学课件中的应用[J];成功(教育);2009年06期
3 岳东海;;阀控非对称缸电液伺服系统中控制策略研究[J];常州信息职业技术学院学报;2006年01期
4 于华艳;岳东海;;基于Simulink模型阀控非对称缸系统动态特性分析[J];常州信息职业技术学院学报;2008年04期
5 吕士楠,林凡,张连毅;捷通华声TTS技术[J];邮电商情;2001年21期
6 董武绍;关于基于多Agent系统的远程教学模式研究[J];电化教育研究;2001年09期
7 曲霖洁,刘培玉;基于Agent的网上教学系统的研究[J];电化教育研究;2002年01期
8 王宇;;Microsoft Agent在英语中的应用[J];电脑学习;2009年05期
9 于卫红;;基于MS Agent的语音识别与合成[J];电脑编程技巧与维护;2008年14期
10 陈超越;;基于VB和SAPI的语音合成的实现[J];电脑编程技巧与维护;2010年18期
中国博士学位论文全文数据库 前1条
1 马鹏飞;全液压推土机液压行驶驱动系统动力学研究[D];长安大学;2006年
中国硕士学位论文全文数据库 前10条
1 雷静;语音识别技术的研究及基本实现[D];武汉理工大学;2002年
2 孙凡;基于INTERNET的自动语音应答系统的研究和实现[D];太原理工大学;2002年
3 陈荔龙;连续语音识别搜索算法的研究与应用[D];西北工业大学;2002年
4 李廷军;MS Agent技术和建构主义理论在英语学习中的应用[D];华中师范大学;2003年
5 李新海;COM+技术及应用研究[D];沈阳工业大学;2003年
6 朱淑琴;语音识别系统关键技术研究[D];西安电子科技大学;2004年
7 张众;小型语音识别系统的研究和开发[D];天津大学;2004年
8 梁青;基于COM构件的软件开发[D];哈尔滨理工大学;2004年
9 马俊;语音识别技术研究[D];哈尔滨工程大学;2004年
10 孙炯宁;噪声环境下汉语数字语音识别系统的研究[D];南京信息工程大学;2005年
【二级引证文献】
中国期刊全文数据库 前1条
1 孙强;白书战;李国祥;闫伟;;履带式推土机动力传动系统推土工况建模与仿真[J];农业工程学报;2012年07期
中国博士学位论文全文数据库 前2条
1 周琳;深远海环境监测水声通信仿真方法与信道估计研究[D];中国海洋大学;2011年
2 许平;青藏铁路大风监测预警与行车指挥系统研究[D];中南大学;2009年
中国硕士学位论文全文数据库 前5条
1 温晓佩;数字集成电路测试系统软件设计[D];电子科技大学;2011年
2 吴丹;基于小型呼叫中心的预约诊疗系统的设计与实现[D];齐齐哈尔大学;2011年
3 盖龙涛;语音控制动画技术在在线卡拉OK中的应用研究[D];哈尔滨工业大学;2008年
4 凌代红;基于MS Agent和TTS的剧本引擎的设计与应用[D];浙江工业大学;2012年
5 杨柳青;语音人机交互及其在智能调度中的应用[D];山东大学;2013年
【二级参考文献】
中国期刊全文数据库 前7条
1 陈方,高升;语音识别技术及发展[J];电信科学;1996年10期
2 韩晓刚,徐丽;分布式开放环境中的多agent合作模型[J];湖南大学学报(自然科学版);1997年05期
3 胡华,俞宏知;面向软件体系结构和Agent联邦的软件系统合成[J];计算机工程;2001年09期
4 林道发,罗万伯,杨家沅;用矢量量化和隐马尔可夫模型实现英语话句的识别[J];四川大学学报(自然科学版);1991年03期
5 林道发,杨家沅,罗万伯,王跟东;认人的限定主题的连续汉语语音识别系统的研究[J];声学学报;1992年06期
6 谭凯,林子禹,彭德纯,唐胜群;多级正交软件体系结构及其应用[J];小型微型计算机系统;2000年02期
7 胡华,高济,何志均;开放式软件体系结构描述语言设计[J];小型微型计算机系统;2000年02期
【相似文献】
中国期刊全文数据库 前10条
1 程庆祥;;语音识别电路简介[J];家电科技;1990年02期
2 张连海,韩华,王炳锡;过零周期转移概率矩阵语音识别方法的改进[J];信息工程学院学报;1994年01期
3 闫守华;语音控制系统的研制[J];成都气象学院学报;1997年03期
4 李晓霞,王东木,李雪耀;语音识别技术评述[J];计算机应用研究;1999年10期
5 李虎生,刘加,刘润生;利用多层感知机映射提高不匹配环境下的语音识别性能[J];电路与系统学报;1999年04期
6 陈海英,于金辉;利用语音识别进行信息检索[J];情报学报;2003年01期
7 刘占军;;我的Word更“听话”[J];电脑知识与技术(经验技巧);2010年10期
8 赵显富;;译者的话[J];计算技术与自动化;1985年04期
9 张忠平;文成义;;基于BP神经网络的汉语语音识别的研究[J];电声技术;1992年09期
10 战普明,王作英,陆大 ;语音识别隐马尔可夫模型的改进[J];电子学报;1994年01期
中国重要会议论文全文数据库 前10条
1 计天颖;王作英;陆大金;;有限命令集连续语音识别[A];第三届全国人机语音通讯学术会议论文集[C];1994年
2 余鹏;王作英;;语音识别码本状态间的线性和非线性相关性[A];第六届全国人机语音通讯学术会议论文集[C];2001年
3 宋君;葛余博;;应用于鲁棒语音识别的置信度加权特征丢失法[A];第七届全国人机语音通讯学术会议(NCMMSC7)论文集[C];2003年
4 靳慧龙;;基于DSP的电视语音拨号遥控技术[A];中国自动化学会、中国仪器仪表学会2004年西南三省一市自动化与仪器仪表学术年会论文集[C];2004年
5 张超;刘轶;郑方;;面向多口音语音识别的声学模型重构[A];第十一届全国人机语音通讯学术会议论文集(二)[C];2011年
6 张超;刘轶;郑方;;面向多口音语音识别的声学模型重构方法[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年
7 马晓川;刘冬;赵荣椿;;孤立短语隐马尔可夫模型自动建模软件的实现[A];第四届全国人机语音通讯学术会议论文集[C];1996年
8 郭晨;;汉语语音技术[A];第一届学生计算语言学研讨会论文集[C];2002年
9 赵海滨;王宏;闻绍飞;;嵌入式语音识别控制机械手的系统设计[A];第二届全国信息获取与处理学术会议论文集[C];2004年
10 刘秉权;张凯;王晓龙;;语音识别中基于规则的语言模型的研究[A];第五届全国人机语音通讯学术会议论文集[C];1998年
中国重要报纸全文数据库 前10条
1 中国科学院声学研究所研究员 俞铁城;解析语音识别的发展现状[N];通信产业报;2004年
2 黄梦;方案商积极切入语音识别市场[N];电脑商报;2006年
3 本报记者 刘学习;认准语音识别的“内核”[N];计算机世界;2002年
4 ;“超人类语音识别”计划[N];中国计算机报;2002年
5 ;Intel涉足语音识别[N];计算机世界;2003年
6 本报记者 艾文;语音识别:IBM继续领跑[N];中国计算机报;2001年
7 小雷;芝麻开门[N];电脑商报;2006年
8 记者 潘治;汽车真能听话[N];新华每日电讯;2002年
9 闫婷;语音识别 理想与现实的距离[N];计算机世界;2007年
10 本报记者 钟洪奇;Pattek语音识别产品: 找一条走得通的路[N];计算机世界;2002年
中国博士学位论文全文数据库 前10条
1 刘纪平;多重演化神经网络在语音识别中的应用[D];武汉大学;2011年
2 孙颖;情感语音识别与合成的研究[D];太原理工大学;2011年
3 李伟;基于内容的汉语语音检索技术研究与系统实现[D];清华大学;2011年
4 吕钊;噪声环境下的语音识别算法研究[D];安徽大学;2011年
5 司博宇;基于语音识别的构音及语音障碍自动评估系统研制[D];华东师范大学;2014年
6 奉小慧;音频噪声环境下唇动信息在语音识别中的应用技术研究[D];华南理工大学;2010年
7 丁沛;语音识别中的抗噪声技术[D];清华大学;2003年
8 宁爱平;人工蜂群算法及其在语音识别中的应用研究[D];太原理工大学;2013年
9 刘庆升;计算机辅助普通话发音评测关键技术研究[D];中国科学技术大学;2010年
10 田斌;实用化汉语语音识别理论及关键技术研究[D];西安电子科技大学;1999年
中国硕士学位论文全文数据库 前10条
1 王霅煜;基于VQ和ASR的多媒体课件检索[D];上海交通大学;2010年
2 郭恒飞;基于非特定人车载电器语音集成控制系统的设计与实现[D];合肥工业大学;2011年
3 王秋杰;TD-SCDMA网络测试软件中语音识别模块的设计与实现[D];北京邮电大学;2011年
4 彭峰;基于SALT的交互式语音应答系统——SALT技术的分析与应用[D];四川大学;2004年
5 江超;视频语义提取分析研究[D];西安电子科技大学;2011年
6 朱晗鸣;嵌入式小词汇量语音识别系统的设计与实现[D];大连理工大学;2005年
7 龙丽霞;基于实例语境的语音识别后文本检错与纠错研究[D];北京邮电大学;2010年
8 宋叔飚;神经网络在语音识别中的应用研究[D];西北工业大学;2002年
9 庞雄昌;语音识别及其定点DSP实现[D];西安电子科技大学;2004年
10 熊飞丽;语音识别技术在语言教学软件中的应用研究[D];国防科学技术大学;2002年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026