收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

语音片段检索算法的研究与应用

何明哲  
【摘要】:本文研究了现有语音检索中语音到文本和语音到语音两种检索方式。对语音端点检测中双门限法进行了改进,提出了双向双门限加基于波形统计的字切割算法,利用动态时间弯折法对该方法进行了无阈值、自动合并波形的改进。并针对现有检索算法中要切分段和抽取关键词的缺点,尝试了一种基于动态时间弯折的不需切割的连续语音片段检索算法,并对该方法进行了有效的评估。 另外针对语音到语音的检索方式中只应用了语音的特征匹配、语音到文本的检索方式中只应用了语音的出现概率问题,提出了一种基于隐马尔科夫模型的连续语音到语音检索算法。该算法同时利用了被检索语音和检索语音之间的特征相似度以及语音前后帧之间的出现概率,实现了较全面的语音到语音检索方式,同时由于该算法的隐马尔科夫概率矩阵的计算由条件概率方式得到,无需进行反复迭代训练,训练时间大大的提高了。针对现有语音转文本的方式在语音检索中准确度不高的问题,提出一种带条件概率的中间模糊音素声学模型,将语音识别成一种模糊的中间音素(即将发音类似的音素聚类成一个)的文本,通过文本检索方法检索大概位置,然后再使用不切割语音到语音算法来进行精确的查找。 最后针对上面两种语音到语音检索算法,本文给出了特殊情况下两者等价性的分析。并比较他们在实际应用场合上各自的优缺点。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 周曦;戴蓓蒨;陈雁翔;李辉;;基于纯度和BBN算法的无监督的话者聚类[J];模式识别与人工智能;2005年04期
2 钟山;刘加;;MLLR特征的SVM语种识别算法[J];清华大学学报(自然科学版);2009年S1期
3 张俊星;刘宇;;基于二级搜索模型的有声出版物语音分割算法[J];吉林大学学报(工学版);2009年S2期
4 卢颖;;《人民日报》元旦社论的语音修辞[J];新闻爱好者;2010年19期
5 罗元;李嘉穗;徐秉铮;;汉语语音“通—断”模型的统计分析[J];电信科学;1987年07期
6 陈雁翔;戴蓓蒨;周曦;李辉;;基于帧间相关特性和汉语音节组成规则的连接数字串的音节切分[J];模式识别与人工智能;2003年03期
7 王炜;吕萍;颜永红;;一种改进的基于层次聚类的说话人自动聚类算法[J];声学学报(中文版);2008年01期
8 谢贵武;杨继红;肖勇;闵刚;;基于语音分段的自适应时长调整算法[J];军事通信技术;2008年02期
9 肖大光;多功能数字式录音机设计[J];电子技术;1997年02期
10 李祖鹏,姚佩阳;一种语音段起止端点检测新方法[J];电讯技术;2000年03期
11 顾亚强;赵晖;吴波;;一种语音信号端点检测的改进方法[J];计算机仿真;2010年05期
12 范冰冰;荀殿栋;;模拟语音置乱保密系统的安全性[J];军事通信技术;1988年03期
13 李庆明,秦菊贤;采用单片机技术设计CAI通用智能控制器[J];华北工学院学报;1994年01期
14 赵跃进,刘海城,钱永强;单片机在小型变电站故障检测与报警中的应用[J];计算机工程与设计;1997年06期
15 孟军,陈日新;ISD语音芯片应用开发环境研究[J];计算技术与自动化;1999年01期
16 贾强;;基于51单片机的语音控制系统[J];天津科技;2009年01期
17 陈日新,孟军,李思昆;一种基于语音段管理的语音芯片体系结构设计[J];常德师范学院学报(自然科学版);1999年01期
18 张毅,唐红;用ISD器件实现现场语音分段录音与随机组合放音[J];电子技术应用;2002年03期
19 马震;李建磊;陈延萍;;基于TMS320DM6446的MELP/CELP混合编码方法研究与实现[J];电子器件;2007年06期
20 郑铁然;韩纪庆;;基于音节Lattice的汉语语音检索技术及其索引去冗余方法[J];声学学报(中文版);2008年06期
中国重要会议论文全文数据库 前10条
1 陈立春;董长宝;;具有网络监控管理功能的铁路运输语音记录仪的研究[A];《铁路车务设备信息管理系统研讨会》论文集[C];2011年
2 张金爽;于洪志;郑文思;吕士良;;言语呼吸韵律分析平台的设计与实现[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年
3 司罗;胡起秀;金琴;;完全无监督的双人对话中的说话人分隔[A];第九届全国信号处理学术年会(CCSP-99)论文集[C];1999年
4 肖熙;王侠;王作英;;非齐次HMM语音段长模型的Forward-Backward算法[A];第七届全国人机语音通讯学术会议(NCMMSC7)论文集[C];2003年
5 陈凡;罗四维;;一个实用语音开发应用系统的设计与实现[A];第二届全国人机语音通讯学术会议论文集[C];1992年
6 沈亚强;程仲文;任德官;;带噪语音信号的信号模型参数和噪声模型参数的辨别[A];第三届全国人机语音通讯学术会议论文集[C];1994年
7 李鹏伟;穆道生;唐晓刚;;基于多特征值的静音检测算法在G.729中的应用研究[A];2010通信理论与技术新发展——第十五届全国青年通信学术会议论文集(下册)[C];2010年
8 康恒;刘文举;;基于Sinusoidal+全极点模型的语音频谱平滑[A];第八届全国人机语音通讯学术会议论文集[C];2005年
9 张华;唐赟;刘文举;;基于统计的汉语音素类别标识技术及其在语音识别中的应用[A];第八届全国人机语音通讯学术会议论文集[C];2005年
10 徐明;胡瑞敏;黄云森;;基于音素识别的语音评价方法[A];第二届和谐人机环境联合学术会议(HHME2006)——第15届中国多媒体学术会议(NCMT'06)论文集[C];2006年
中国博士学位论文全文数据库 前10条
1 赵腊生;语音情感特征提取与识别方法研究[D];大连理工大学;2010年
2 双志伟;个性化语音生成研究[D];中国科学技术大学;2011年
3 杨于村;基于公众移动通信网的端到端加密语音传输技术研究[D];华南理工大学;2009年
4 田岚;增强电子耳蜗听感知的处理策略研究[D];天津大学;2009年
5 方瑜;语音增强相关问题研究[D];北京邮电大学;2012年
6 王海艳;基于统计模型的语音增强算法研究[D];吉林大学;2011年
7 周文君;舰船VDR人声识别技术研究[D];哈尔滨工程大学;2009年
8 王娜;基于小波变换与约束方差噪声谱估计的语音增强算法研究[D];燕山大学;2011年
9 瞿仰;基于声调识别的汉语计算机辅助学习系统研究[D];华东师范大学;2012年
10 尹伟;基于模型的语音增强方法及质量评估研究[D];武汉大学;2009年
中国硕士学位论文全文数据库 前10条
1 何明哲;语音片段检索算法的研究与应用[D];华南理工大学;2012年
2 王冲;无人机语音指令控制系统技术研究[D];南京航空航天大学;2012年
3 郭永亮;嵌入式语音指令处理与识别方法的研究[D];南京航空航天大学;2010年
4 李海忠;语音增强算法研究与应用[D];西华大学;2010年
5 卓露;语音增强算法的研究与实现[D];湖北工业大学;2011年
6 杨典兵;端到端保密通信中的类语音调制解调研究[D];解放军信息工程大学;2009年
7 李秀珍;语音识别算法及应用技术研究[D];重庆大学;2010年
8 杨斌;机载数字化音响中的降噪技术研究[D];电子科技大学;2011年
9 龚亮;单通道语音增强算法的改进及DSP实现[D];南京信息工程大学;2011年
10 吴晓宇;VoIP系统中语音增强算法的研究与应用[D];北京邮电大学;2010年
中国重要报纸全文数据库 前10条
1 江西 林慧勇;语音合成芯片MSM6295及其应用[N];电子报;2006年
2 中国科学院自动化研究所模式识别国家重点实验室 于剑陶建华;个性化语音生成技术面面观[N];计算机世界;2007年
3 ;探索普通话自然连续语音之规律[N];光明日报;2001年
4 ;与“小超人”对话[N];中国计算机报;2001年
5 曲豆;声纹鉴定找到敲诈人[N];北京科技报;2004年
6 上海 孙焕挺;OTP型语音电路应用[N];电子报;2003年
7 王翌;网摘的“危”与“机”[N];计算机世界;2005年
8 ;人机对话无障碍[N];中国计算机报;2002年
9 清华大学 刘加;识别语音的几种依据[N];计算机世界;2006年
10 孙晓闻;语音技术——社保12333电话查询系统的新亮点[N];中国劳动保障报;2006年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978