收藏本站
《哈尔滨工程大学》 2012年
收藏 | 手机打开
二维码
手机客户端打开本文

基于音节片Lattice的语音检索关键问题研究

陈国兴  
【摘要】:随着互联网和信息技术的快速发展,多媒体信息资源越来越多,对多媒体信息进行检索和分类也越来越重要。广播、会议、互联网上的语音数据越来越多,如何在海量的语音库当中搜索出我们需要的信息,成为亟待解决的问题。 所谓语音文档检索是指,根据用户输入的查询请求,在语音资源中搜索和返回与查询请求中关键词相关联的语音段或语音文件的处理过程。语音文档检索一般包含两个阶段:离线索引阶段和在线检索阶段。离线索引阶段主要包括语音识别和索引构建两大模块。在线检索的性能和这两个模块息息相关。 语音识别结果有三种形式,One-best、N-best和Lattice形式。Lattice是一种有向无环图形式,包含的候选结果多,可以补偿语音识别错误带来的影响,有效地提高系统的检索性能。因此目前研究人员多采用Lattice作为语音识别的结果,基于Lattice的语音检索也成为主流。在汉语语音识别中,和汉字、词和短语句子相比,音节因为其数量有限,表达内容丰富而成为基元,更重要的是音节可以有效地解决词表外词(OOV)的问题。 在基于音节Lattice的语音文档检索中,Lattice冗余信息多,结构复杂,不便于处理,本文研究了在Lattice基础上生成混淆网络的方法。混淆网络是一种更为简洁高效的网络,接近线性结构,包含的信息丰富并且易于后续处理。和Lattice相比,基于混淆网络构建的索引占用空间更小,更适合后续检索。同时为了提高检索的精度,本文基于文本分析的结果,筛选出词频较高的一些音节组合作为词片,生成音节和音节词片的语言模型,再生成字词混合的Lattice,将其转化为混淆网络,实验证明这种方法有效的提高了识别率。 传统的向量空间模型(VSM)应用于多候选结果的语音文档检索时存在不合理性,本文针对传统的VSM模型进行了改进,改变了权重计算方法,使之更适合基于多候选的混淆网络检索。实验表明,词片的引入大大提高了Lattice和混淆网络的识别率,同时混淆网络的索引形式相比Lattice更为简洁高效、易于处理。同基线系统的检索结果相比,基于混淆网络的语音文档检索精度在准确率和结果排名方面都有大幅提升。
【学位授予单位】:哈尔滨工程大学
【学位级别】:硕士
【学位授予年份】:2012
【分类号】:TN912.34

手机知网App
【参考文献】
中国期刊全文数据库 前10条
1 常凯;;基于TF*IDF垃圾邮件过滤改进算法的研究[J];电脑知识与技术;2010年25期
2 张仰森,徐波,曹元大;自然语言处理中的语言模型及其比较研究[J];广西师范大学学报(自然科学版);2003年01期
3 饶耀全;吴小培;吕钊;;基于HTK的汉语语音售票系统的设计与实现[J];工业控制计算机;2010年10期
4 王欢良;韩纪庆;;基于Lattice分段的高质量混淆网络快速生成方法[J];高技术通讯;2010年05期
5 孙成立;;混淆网络在音频文档检索系统中的应用研究[J];计算机工程与应用;2010年28期
6 吴丽华;罗云锋;张宏斌;;信息检索模型及相关性算法的研究[J];情报杂志;2006年12期
7 孟莎;余鹏;Frank Seide;刘加;;基于后验概率词格的汉语自然对话语音索引[J];清华大学学报(自然科学版);2008年S1期
8 吴斌;刘刚;郭军;;汉语大词汇量连续语音识别中混淆网络算法的研究[J];四川大学学报(工程科学版);2007年S1期
9 郑铁然;韩纪庆;李海洋;;基于词片的语言模型及在汉语语音检索中的应用[J];通信学报;2009年03期
10 石现峰;张学智;张峰;;基于HTK的语音识别系统设计[J];计算机技术与发展;2006年10期
中国博士学位论文全文数据库 前2条
1 王欢良;基于混淆网络和辅助信息的语音识别技术研究[D];哈尔滨工业大学;2007年
2 郑铁然;基于音节网格的汉语语音文档检索方法研究[D];哈尔滨工业大学;2008年
中国硕士学位论文全文数据库 前10条
1 高运霞;基于网格的中文语音文件检索技术的研究[D];哈尔滨工程大学;2010年
2 陈晶;基于词片网格的语音文档主题分类[D];哈尔滨工程大学;2010年
3 刘建舟;术语自动抽取系统的设计及关键技术研究[D];华中师范大学;2004年
4 侯周国;基于HMM的汉语数字语音识别系统研究[D];湖南师范大学;2006年
5 郑毅;文本挖掘及其在文本检索中的应用[D];中国科学院研究生院(计算技术研究所);2002年
6 苏敏;一种基于HMM和RBF网络混合的语音识别算法研究[D];兰州理工大学;2007年
7 刘洋;基于最佳状态数的汉语数字语音识别系统的研究与实现[D];北京邮电大学;2008年
8 项勇;基于DSP和HMM的语音识别系统设计与实现[D];武汉科技大学;2008年
9 李海洋;基于词片和Lattice的汉语语音检索技术研究[D];哈尔滨工业大学;2007年
10 蒋斌;基于停用词处理的汉语语音检索方法[D];哈尔滨工业大学;2008年
【共引文献】
中国期刊全文数据库 前10条
1 时雷;虎晓红;席磊;段其国;;集成学习技术在农业中的应用[J];安徽农业科学;2008年26期
2 时雷;席磊;虎晓红;段其国;;基于支持向量机的农业数据分类研究[J];安徽农业科学;2009年05期
3 时雷;虎晓红;席磊;;基于Naive Bayes算法的大豆病害诊断研究[J];安徽农业科学;2009年11期
4 胡钢,沈文轩;一种基于噪声动态检测的语音端点检测算法[J];鞍山科技大学学报;2004年02期
5 胡钢;;一种语音端点检测算法在DSP上的实现[J];鞍山师范学院学报;2009年06期
6 施俊强,池明敏;基于TMS320C54x DSKplus的实时TCM语音编解码算法的实现[J];半导体技术;2001年08期
7 刘晓志;黄厚宽;尚文倩;;带专业词库的特征选择[J];北京交通大学学报;2006年02期
8 邓勇,施文康;基于TMS320C50的语音频谱分析仪[J];兵工自动化;2000年03期
9 王继祥;刘贵忠;刘广健;高向东;;基于小波谱失真测度的语音质量评估[J];兵工学报;2008年01期
10 徐俊晓,谢锋,江建平,莫运明,郑中华;我国12种无尾类的鸣叫特征参数[J];动物学杂志;2005年03期
中国重要会议论文全文数据库 前10条
1 陆汝华;杨胜跃;樊晓平;;基于CGHMM的轴承故障音频信号诊断方法[A];第二十六届中国控制会议论文集[C];2007年
2 郭巧;张立伟;陆际联;;汉语语音信号的端点检测与切分[A];第九届全国信号处理学术年会(CCSP-99)论文集[C];1999年
3 张连海;王杰锋;王炳锡;;基于语音多带激励模型的基音周期估计算法研究[A];第九届全国信号处理学术年会(CCSP-99)论文集[C];1999年
4 司罗;胡起秀;金琴;;完全无监督的双人对话中的说话人分隔[A];第九届全国信号处理学术年会(CCSP-99)论文集[C];1999年
5 牟峰;俞铁城;杨道淳;;新型半波语音编解码的实现[A];第十届全国信号处理学术年会(CCSP-2001)论文集[C];2001年
6 邹绘华;李双田;;基于频谱斜率约束的变速率语音编码算法研究[A];第十届全国信号处理学术年会(CCSP-2001)论文集[C];2001年
7 李灿伟;杨震;;基于DCT的有色噪声消除算法[A];第十届全国信号处理学术年会(CCSP-2001)论文集[C];2001年
8 周珺;范京;刘惠华;;汉语语音音量和语速变化的自适应的调整[A];第十届全国信号处理学术年会(CCSP-2001)论文集[C];2001年
9 孙海;范京;刘惠华;;汉语连续语音中的单字起止点综合判别的新方法[A];第十届全国信号处理学术年会(CCSP-2001)论文集[C];2001年
10 朱学勇;刘亚康;杨乐;;一种基于MBE模型的2.4Kbps语音编码器算法[A];第十届全国信号处理学术年会(CCSP-2001)论文集[C];2001年
中国博士学位论文全文数据库 前10条
1 黄湘松;基于混淆网络的汉语语音检索技术研究[D];哈尔滨工程大学;2010年
2 洪弘;基于Hilbert-Huang变换的汉语动态特征分析[D];南京大学;2010年
3 李炳龙;文档碎片取证关键技术研究[D];解放军信息工程大学;2007年
4 尹伟;基于模型的语音增强方法及质量评估研究[D];武汉大学;2009年
5 曾庆虎;机械传动系统关键零部件故障预测技术研究[D];国防科学技术大学;2010年
6 黄丽霞;非特定人鲁棒性语音识别中前端滤波器的研究[D];太原理工大学;2011年
7 张翔;文本挖掘技术研究及其在综合风险信息网络中的应用[D];西北大学;2011年
8 双志伟;个性化语音生成研究[D];中国科学技术大学;2011年
9 许敏强;基于话者统计特征和SVM的文本无关话者确认研究[D];中国科学技术大学;2011年
10 高二中;对话电话语音的话者确认研究[D];中国科学技术大学;2011年
中国硕士学位论文全文数据库 前10条
1 王丽敬;地理案例的空间相似性计算[D];山东科技大学;2010年
2 王春力;基于P2P的网络音频捕获与多路混音算法研究[D];山东科技大学;2010年
3 吕万里;中文文本分类技术研究[D];山东科技大学;2010年
4 楼侃;基于DSP的语音信号环境噪声降噪处理技术的研究[D];长春理工大学;2010年
5 靳志强;报告厅环境下语音增强方法研究[D];郑州大学;2010年
6 徐雯;VDR音频数据数字水印算法研究[D];哈尔滨工程大学;2010年
7 王文姝;基于模糊理论的关键词识别算法研究[D];哈尔滨工程大学;2010年
8 刘维巍;语音信号基音周期检测算法研究[D];哈尔滨工程大学;2010年
9 楼佳;基于网络QoS的AMR语音编码算法研究[D];哈尔滨工程大学;2010年
10 高运霞;基于网格的中文语音文件检索技术的研究[D];哈尔滨工程大学;2010年
【二级参考文献】
中国期刊全文数据库 前10条
1 梁南元;书面汉语的自动分词与一个自动分词系统—CDWS[J];北京航空学院学报;1984年04期
2 顾益军,樊孝忠,王建华,汪涛,黄维金;中文停用词表的自动选取[J];北京理工大学学报;2005年04期
3 顾良,刘润生;改进汉语数码语音识别中的语音特征提取性能[J];电路与系统学报;1997年04期
4 顾良,刘润生;汉语数码语音识别:发展现状、难点分析与方法比较[J];电路与系统学报;1997年04期
5 史笑兴,顾明亮,王太君,何振亚;一种时间规整算法在神经网络语音识别中的应用[J];东南大学学报;1999年05期
6 毕静;;自动分类技术研究[J];电脑知识与技术;2009年04期
7 陈方,高升;语音识别技术及发展[J];电信科学;1996年10期
8 江铭虎,袁保宗,林碧琴;神经网络语音识别的研究及进展[J];电信科学;1997年07期
9 林立;朱杰;;基于HTK实时中文语音路名查询系统的设计和实现[J];电子测量技术;2008年03期
10 丁爱明;;作为说话人识别特征参量的M FCC的提取过程[J];电子工程师;2006年01期
中国重要会议论文全文数据库 前3条
1 张艳;徐波;;基于转换的错误学习方法的汉语词性自动标注研究[A];辉煌二十年——中国中文信息学会二十周年学术会议论文集[C];2001年
2 郑铁然;韩纪庆;;汉语语音检索中基于音节的索引方法研究[A];第八届全国人机语音通讯学术会议论文集[C];2005年
3 赵红梅;谢军;吕雅娟;刘群;;第四届全国机器翻译研讨会(CWMT2008)评测报告(公开版)[A];机器翻译研究进展——第四届全国机器翻译研讨会论文集[C];2008年
中国博士学位论文全文数据库 前2条
1 张宏斌;信息获取中的两类不确定问题研究[D];华中科技大学;2004年
2 鄢志杰;声学模型区分性训练及其在自动语音识别中的应用[D];中国科学技术大学;2008年
中国硕士学位论文全文数据库 前10条
1 全必胜;非线性信道传输的码元识别方法研究[D];西北工业大学;2003年
2 陆晔;基于隐马尔可夫算法的上海城市路名语音识别方法研究[D];华东师范大学;2002年
3 庞雄昌;语音识别及其定点DSP实现[D];西安电子科技大学;2004年
4 修国浩;基于WD/HMM的语音识别算法研究[D];燕山大学;2004年
5 马俊;语音识别技术研究[D];哈尔滨工程大学;2004年
6 郑海树;面向语音检索的汉语关键词识别技术研究及应用[D];浙江大学;2005年
7 徐春燕;非特定人连续语音识别的理论、分析和实验[D];浙江工业大学;2005年
8 张静亚;基于HMM的汉语连续数字语音识别[D];苏州大学;2005年
9 苏明武;基于DSP的语音识别技术研究及实现[D];哈尔滨工程大学;2005年
10 赵姝彦;HMM和神经网络用于语音识别的算法研究[D];太原理工大学;2005年
【相似文献】
中国期刊全文数据库 前10条
1 章文义,朱杰;几种无语音检测噪音估计方法的比较研究[J];计算机工程与设计;2003年10期
2 林鑫;陈桦;王开志;王继成;;语音驱动唇形自动合成算法[J];计算机工程;2007年17期
3 蔡铁;;基于在线单类支持向量机的自适应语音活动检测[J];深圳信息职业技术学院学报;2008年02期
4 章钊;郭武;;话者识别中结合模型和能量的语音激活检测算法[J];小型微型计算机系统;2010年09期
5 朱淑琴,裘雪红;一种精确检测语音端点的方法[J];计算机仿真;2005年03期
6 李艳雄;贺前华;陈楠;齐朝晖;;基于谱稳定性特征的语音与笑声区分新方法[J];电子与信息学报;2008年06期
7 高福友;陈雁翔;;一种基于说话者的无监督语音分割算法[J];合肥工业大学学报(自然科学版);2010年05期
8 Takao ,刘吉峰;语音接口[J];今日电子;1996年Z1期
9 祝庆绩,钱国荣,李治柱;面向移动电话应用的粤语语音数据库构建[J];计算机应用与软件;2004年07期
10 刘娟花;李福德;;一种改进的小波域语音去噪方法研究[J];西安工程科技学院学报;2006年01期
中国重要会议论文全文数据库 前9条
1 田野;王作英;陆大金;;基于韵律结构信息的非语音拒识[A];第六届全国人机语音通讯学术会议论文集[C];2001年
2 徐明;胡瑞敏;黄云森;;基于音素识别的语音评价方法[A];第二届和谐人机环境联合学术会议(HHME2006)——第15届中国多媒体学术会议(NCMT'06)论文集[C];2006年
3 王欢良;韩纪庆;李海峰;王承发;;面向嵌入式应用的小词汇量语音串识别系统[A];第七届全国人机语音通讯学术会议(NCMMSC7)论文集[C];2003年
4 那斯尔江·吐尔逊;吾守尔·斯拉木;麦麦提艾力;;维吾尔语大词汇量连续语音识别研究——语音语料库的建立[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年
5 简志华;王向文;;考虑帧间信息的语音转换算法[A];浙江省信号处理学会2012学术年会论文集[C];2012年
6 魏维;马海燕;;一种丢失语音信包重建的新算法[A];通信理论与信号处理新进展——2005年通信理论与信号处理年会论文集[C];2005年
7 陈凡;罗四维;;一个实用语音开发应用系统的设计与实现[A];第二届全国人机语音通讯学术会议论文集[C];1992年
8 刘红星;戴蓓蒨;陆伟;;基于图像增强方法的共振峰谐波能量参数的语音和端点检测[A];第九届全国人机语音通讯学术会议论文集[C];2007年
9 林爱华;张文俊;王毅敏;;基于肌肉模型的语音驱动唇形动画[A];第十三届全国图象图形学学术会议论文集[C];2006年
中国重要报纸全文数据库 前5条
1 atvoc;数码语音电路产品概述[N];电子资讯时报;2008年
2 记者 李山;德用双音素改进人工语音表达[N];科技日报;2012年
3 中国科学院自动化研究所模式识别国家重点实验室 于剑陶建华;个性化语音生成技术面面观[N];计算机世界;2007年
4 江西 林慧勇;语音合成芯片MSM6295及其应用[N];电子报;2006年
5 ;与“小超人”对话[N];中国计算机报;2001年
中国博士学位论文全文数据库 前9条
1 陶冶;文本语音匹配的研究和应用[D];山东大学;2009年
2 何俊;声纹身份识别中非常态语音应对方法研究[D];华南理工大学;2012年
3 李冬冬;基于拓展和聚类的情感鲁棒说话人识别研究[D];浙江大学;2008年
4 双志伟;个性化语音生成研究[D];中国科学技术大学;2011年
5 古今;语音感知认证的关键技术研究[D];中国科学技术大学;2009年
6 彭波;Internet上语音的鲁棒性传输研究[D];华南理工大学;2001年
7 黄湘松;基于混淆网络的汉语语音检索技术研究[D];哈尔滨工程大学;2010年
8 应娜;基于正弦语音模型的低比特率宽带语音编码算法的研究[D];吉林大学;2006年
9 田立斌;语音通信质量客观评价、有效接收及错误恢复算法研究[D];华南理工大学;2004年
中国硕士学位论文全文数据库 前10条
1 周慧;基于PAD三维情绪模型的情感语音转换与识别[D];西北师范大学;2009年
2 李尘一;基于联合得分的语音置信度评估系统的研究与设计[D];内蒙古大学;2006年
3 朱君波;PCA在语音检测中的应用研究[D];浙江工业大学;2004年
4 陈宇超;广播语音的分割与分类研究[D];北京邮电大学;2009年
5 何明哲;语音片段检索算法的研究与应用[D];华南理工大学;2012年
6 邸燕君;基于感知哈希的语音内容认证方法研究[D];兰州理工大学;2013年
7 杨帅;聋儿语音恢复系统的语音识别研究[D];山东大学;2009年
8 林剑峰;自主心智发育机器人的语音感知映射[D];复旦大学;2008年
9 卢红伟;基于DSP语音联合降噪系统的研究[D];南京林业大学;2009年
10 龚小燕;极低速率语音通信的实现[D];山东大学;2009年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026