收藏本站
《哈尔滨工程大学》 2010年
收藏 | 手机打开
二维码
手机客户端打开本文

基于模糊理论的关键词识别算法研究

王文姝  
【摘要】: 关键词识别是从一段连续的语音流当中识别出特定的一个或若干个关键词的技术,是连续语音识别的一个分支。关键词识别技术相对于连续语音识别来说具有耗时短、准确率高等特点,在很多领域具有广泛的应用前景,越来越受到人们的重视。 本文主要面向汉语小词汇量的基于隐马尔可夫模型的关键词技术。由于关键词识别不受说话人及说话方式的限制,往往在一段连续的语音流中出现若干与关键词发音相近的易混淆的非关键词,或者关键词之间的发音相似,使系统的识别率下降得很快。针对这样的问题,本文采用自行录制的语音,从对语音信号的预处理开始,采用短时平均能量法和短时平均幅度法对语音信号的始点与末点进行粗判,去除语音信号的无声段。提取10维MFCC倒谱系数及其一阶差分参数作为特征矢量,对关键词和词表外词采用连续隐马尔可夫模型进行建模。训练阶段,采用Baum-Welch算法进行重估迭代。在关键词检出阶段,采用帧同步Viterbi搜索算法,得到若干候选关键词。 在关键词确认阶段,为了避免与关键词发音相似的非关键词取代真正的关键词及因为反词模型的选取不够完善而引起的误识,在确认之前采用模糊c均值聚类的方法,引入隶属度原则,以关键词模型和反词模型为聚类中心,对候选关键词进行聚类,根据隶属矩阵确认候选关键词隶属于哪一类,将聚类在反词模型周围的候选拒识掉,在确认阶段,采用聚类后得到的更具代表性的反词模型,应用似然准则对关键词进行最后的确认。另外,还对关键词混淆网络进行了研究与实验,并作为与引入模糊理论的关键词识别的对比实验。实验表明,引入模糊聚类后,整个系统的识别率有了明显的提高,说明了算法的有效性。针对聚类过程中产生远离聚类中心的野点的问题,使用了一种改进的模糊c均值聚类方法,使聚类的效果更好更准确。
【学位授予单位】:哈尔滨工程大学
【学位级别】:硕士
【学位授予年份】:2010
【分类号】:TP391.43

【参考文献】
中国期刊全文数据库 前8条
1 李洁;高新波;焦李成;;基于特征加权的模糊聚类新算法[J];电子学报;2006年01期
2 王欢良;韩纪庆;郑铁然;李海峰;;基于K-L散度的最大后验弧主导的混淆网络生成算法[J];电子与信息学报;2008年05期
3 吴旭辉,吴亚栋;基于特征空间轨迹匹配方式的语音关键词检测法[J];计算机工程与应用;2003年36期
4 叶靓;王智斌;邵谦明;;基于相关反馈的语音检索引擎[J];计算机工程;2007年17期
5 郑方,徐明星,牟晓隆,武健,吴文虎,方棣棠;HarkMan──A Vocabulary-Independent Keyword Spotter for Spontaneous Chinese Speech[J];Journal of Computer Science and Technology;1999年01期
6 王让定;袁旭海;徐霁;;一种新颖的混合语音检索算法[J];计算机应用研究;2008年05期
7 高新波,谢维信;模糊聚类理论发展及应用的研究进展[J];科学通报;1999年21期
8 俞一彪,赵鹤鸣,周旭东;运用互信息匹配及关键词分析的语音对话系统[J];小型微型计算机系统;2003年01期
中国博士学位论文全文数据库 前5条
1 林琳;基于模糊聚类与遗传算法的说话人识别理论研究及应用[D];吉林大学;2007年
2 王坚;语音识别中的说话人自适应研究[D];北京邮电大学;2007年
3 孙成立;语音关键词识别技术的研究[D];北京邮电大学;2008年
4 王欢良;基于混淆网络和辅助信息的语音识别技术研究[D];哈尔滨工业大学;2007年
5 曲福恒;一类模糊聚类算法研究及其应用[D];吉林大学;2009年
中国硕士学位论文全文数据库 前10条
1 郑海树;面向语音检索的汉语关键词识别技术研究及应用[D];浙江大学;2005年
2 张战;面向实时应用的汉语关键词检出技术研究[D];哈尔滨工业大学;2006年
3 秦磊;基于HMM的关键词检测系统[D];华东师范大学;2007年
4 杨毅玲;基于HMM/AIS的关键词检测系统[D];哈尔滨工程大学;2007年
5 沈孙园;基于仿生模式识别的连续语音关键词识别的研究[D];浙江工业大学;2007年
6 徐毅;基于模糊理论的语音关键词识别[D];上海师范大学;2007年
7 孔攀;模糊聚类分析及其有效性研究[D];西南大学;2009年
8 章洁;大词表自然语音关键词识别系统的研究与实现[D];北京交通大学;2009年
9 朱岩;汉语小词汇量非特定人关键词检出算法研究[D];东北师范大学;2009年
10 蒋鑫;语音关键词识别技术的研究及应用[D];北京邮电大学;2009年
【共引文献】
中国期刊全文数据库 前10条
1 王全凤;郑浩;;基于径向基函数神经网络的高层建筑结构选型[J];四川建筑科学研究;2010年05期
2 罗云贵;张友纯;;嵌入式语音门禁系统的设计与实现[J];安防科技;2010年02期
3 李玲玲;辛浩;;FCM算法及其有效性度量方法[J];安徽电子信息职业技术学院学报;2011年05期
4 张根耀,李竹林,赵宗涛;遮挡情况下运动目标的跟踪[J];安徽大学学报(自然科学版);2003年03期
5 张道信,周爱毓;语音信号实时降噪软件的设计[J];安徽大学学报(自然科学版);2004年04期
6 相征;朗朗;王静;;基于基音频能值的端点检测算法[J];安徽工程科技学院学报(自然科学版);2008年03期
7 陈弋兰;王鸣;孙书诚;;朴素贝叶斯分类器的误差估计[J];安徽工程科技学院学报(自然科学版);2008年04期
8 张红涛;胡玉霞;张恒源;顾波;;储粮害虫图像识别中的特征压缩研究[J];安徽农业科学;2008年27期
9 黄初龙;邓伟;卢晓宁;;区域农业水资源可持续利用模糊综合评价[J];安徽农业科学;2009年05期
10 郗伟东;石玉月;田巍;;基于风险模式提取的农户生猪饲养规制研究[J];安徽农业科学;2009年07期
中国重要会议论文全文数据库 前10条
1 刘志斌;金连文;;候选字静态生成技术及其在两级LDA汉字识别中的应用[A];第二十六届中国控制会议论文集[C];2007年
2 张彬;金连文;;基于AdaBoost的手写体汉字相似字符识别[A];第二十六届中国控制会议论文集[C];2007年
3 吕蓬;柳亦兵;马强;魏于凡;;支持向量机在齿轮智能故障诊断中的应用研究[A];第二十六届中国控制会议论文集[C];2007年
4 梁禹;王义刚;王娜;;基于支持向量机的电力电子电路故障诊断[A];第二十六届中国控制会议论文集[C];2007年
5 赵建玉;贾磊;陈月辉;张勇;;基于粒子群优化的信号交叉口交通流预测模型[A];第二十六届中国控制会议论文集[C];2007年
6 刘华;张建华;王娆芬;王行愚;;人机系统操作员功能状态的模糊聚类方法[A];第二十九届中国控制会议论文集[C];2010年
7 董静;刘健刚;;英语寂语声信号检测[A];2011'中国西部声学学术交流会论文集[C];2011年
8 晋朝勃;胡刚强;史广智;李玉阳;;一种采用支持向量机的水中目标识别方法[A];中国声学学会水声学分会2011年全国水声学学术会议论文集[C];2011年
9 何佳若;曾向阳;张春雷;;室内语音报警词识别系统设计[A];第二届西安-上海两地声学学术会议论文集[C];2011年
10 徐晨;曹辉;;一种语音信号生成的数字模型的研究[A];第二届西安-上海两地声学学术会议论文集[C];2011年
中国博士学位论文全文数据库 前10条
1 黄湘松;基于混淆网络的汉语语音检索技术研究[D];哈尔滨工程大学;2010年
2 梁洪;基于内容的医学图像检索及语义建模关键技术研究[D];哈尔滨工程大学;2010年
3 任桢;图像分类任务的关键技术研究[D];哈尔滨工程大学;2010年
4 殷志伟;基于统计学习理论的分类方法研究[D];哈尔滨工程大学;2009年
5 孔凡芝;引线键合视觉检测关键技术研究[D];哈尔滨工程大学;2009年
6 姜延吉;多传感器数据融合关键技术研究[D];哈尔滨工程大学;2010年
7 董慧群;代建制项目风险预警管理研究[D];辽宁工程技术大学;2010年
8 李桃迎;交通领域中的聚类分析方法研究[D];大连海事大学;2010年
9 乔小燕;基于生物形态学的赤潮藻显微图像分割与特征提取研究[D];中国海洋大学;2010年
10 陈志国;基于群体智能的机器视觉的关键技术研究[D];江南大学;2010年
中国硕士学位论文全文数据库 前10条
1 杜二玲;拟概率空间上等均值噪声下统计学习理论的理论基础[D];河北大学;2007年
2 朱杰;一种基于聚类的支持向量机反问题求解算法[D];河北大学;2007年
3 单文娟;铝电解槽焙烧与启动过程危险源辨识与评价研究[D];河南理工大学;2010年
4 常绪华;基于MATLAB综采面采空区自燃特性分析研究[D];河南理工大学;2010年
5 廖甜甜;白细胞图像语义识别分类的研究[D];南昌航空大学;2010年
6 黄正荣;基于振动波的高速公路车辆行驶状态辨识理论研究[D];南昌航空大学;2010年
7 王焯;基于模糊理论的尾矿坝安全现状综合评价[D];山东科技大学;2010年
8 刘棉;人机划拳系统的实现[D];山东科技大学;2010年
9 刘桂珍;颅骨三维重建与信息提取[D];山东科技大学;2010年
10 张海峰;空间三维信息重构与飞行器路径规划[D];山东科技大学;2010年
【二级参考文献】
中国期刊全文数据库 前10条
1 于剑,程乾生;模糊划分的一个新定义及其应用[J];北京大学学报(自然科学版);2000年05期
2 黄聪明,陈湘秀;小生境遗传算法的改进[J];北京理工大学学报;2004年08期
3 苏广川;强噪声环境下汉语语音识别的模糊分类算法[J];北京理工大学学报;1997年06期
4 李虎生,杨明杰,刘润生;汉语数码语音识别自适应算法[J];电路与系统学报;1999年02期
5 邓浩江,王守觉,邢藏菊,李倩;基于聚类统计与文本无关的说话人识别研究[J];电路与系统学报;2001年03期
6 肖述才,王作英;端点检测中的一种新的对数能量特征[J];电声技术;2004年06期
7 Tanja C. Hofner,乔宗标;高速模数转换器动态参数的定义和测试[J];电子产品世界;2001年02期
8 杜利民;自动语言辨识研究(下)[J];电子科技导报;1996年05期
9 俞一彪,袁保宗;连续语音识别中句法结构知识的利用[J];电子学报;1990年06期
10 刘健庄;基于二维直方图的图象模糊聚类分割方法[J];电子学报;1992年09期
中国博士学位论文全文数据库 前3条
1 裴继红;基于模糊信息处理的图像分割方法研究[D];西安电子科技大学;1998年
2 贺苏宁;基于语音识别基元声学整体结构特征的识别模型研究[D];电子科技大学;2005年
3 雷震春;支持向量机在说话人识别中的应用研究[D];浙江大学;2006年
中国硕士学位论文全文数据库 前8条
1 刘鑫;电话信道自然语音关键词检测[D];中国人民解放军信息工程大学;2002年
2 陈荔龙;连续语音识别搜索算法的研究与应用[D];西北工业大学;2002年
3 唐方坤;基于仿生模式识别和多权值神经元网络的脱机手写汉字识别研究[D];四川大学;2004年
4 郑海树;面向语音检索的汉语关键词识别技术研究及应用[D];浙江大学;2005年
5 王义元;基于独立分量分析和遗传算法的说话人辨认[D];吉林大学;2005年
6 张战;面向实时应用的汉语关键词检出技术研究[D];哈尔滨工业大学;2006年
7 秦磊;基于HMM的关键词检测系统[D];华东师范大学;2007年
8 王海龙;汉语关键词识别与主题信息提取的研究及应用[D];北京交通大学;2007年
【相似文献】
中国期刊全文数据库 前10条
1 ;在学术论文中规范关键词选择的通知[J];稀有金属材料与工程;2004年05期
2 本刊编辑部;《真空与低温》期刊关键词选择的规定[J];真空与低温;2004年02期
3 ;规范关键词选择的决定(试行)[J];真空科学与技术;2004年01期
4 ;关于在学术论文中规范关键词选择的决定(试行)[J];量子光学学报;2002年03期
5 ;关于在学术论文中规范关键词选择的决定(试行)[J];量子光学学报;2002年04期
6 ;关于在中国科协系统科技期刊中规范关键词选择的决定[J];学会;2002年11期
7 ;关于在学术论文中规范关键词选择的规定(试行)[J];学会;2002年11期
8 ;关于在学术论文中规范关键词选择的规定(试行)[J];照明工程学报;2002年04期
9 ;关于在学术论文中规范关键词选择的规定(试行)[J];图书馆建设;2003年01期
10 ;关于在学术论文中规范关键词选择的规定(试行)[J];现代机械;2003年03期
中国重要会议论文全文数据库 前10条
1 ;关于在中国科协系统科技期刊中规范关键词选择的决定(试行)[A];中国真空学会五届三次理事会暨学术会议论文集[C];2002年
2 ;规范关键词选择的决定(试行)[A];中国真空学会2006年学术年会论文集[C];2006年
3 ;规范关键词选择的决定(试行)[A];薄膜技术学术研讨会论文集[C];2003年
4 ;规范关键词选择的决定(试行)[A];全国薄膜技术学术研讨会论文集[C];2006年
5 ;规范关键词选择的决定(试行)[A];中国真空学会第六届全国会员大会暨学术会议论文集[C];2004年
6 刘桂云;;现代护理科研论文写作经验[A];第四届全军腰腿痛学术研讨会、第五届全国肢残康复护理研讨会论文选编[C];2005年
7 刘方舟;施勤;陶建华;;基于最大熵模型的多音字消歧[A];第九届全国人机语音通讯学术会议论文集[C];2007年
8 杜冠辉;李强;吴淑金;;英文摘要写作存在的问题及修改方法初探[A];“广东科技情报服务促进广东经济发展”综合研讨会论文集[C];2007年
9 陈奎宁;;科技文章审读200问——为编辑和作者[A];四川省科技期刊编辑学会论文集[C];1988年
10 ;《真空科学与技术学报》征稿说明[A];中国真空学会2006年学术年会论文集[C];2006年
中国重要报纸全文数据库 前1条
1 主持人 本报记者 姜晨怡 本报实习生 冯志云;搜索也泄密?我们该怎样规范搜索信息[N];科技日报;2011年
中国硕士学位论文全文数据库 前4条
1 李伟;Hidden Web搜索技术的研究[D];中国石油大学;2008年
2 金恬;语种识别中的隐含语义分析[D];中国科学技术大学;2010年
3 闫喜亮;基于情感本体的网络教育资源标注模型的设计与实现[D];南京理工大学;2011年
4 宋杰;改进的基于串匹配的中文文档复制检测方法研究[D];湖南大学;2012年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026