收藏本站
《哈尔滨工程大学》 2010年
收藏 | 手机打开
二维码
手机客户端打开本文

基于词片网格的语音文档主题分类

陈晶  
【摘要】:语音文档主题分类是指根据语音文档的属性或内容,将大量的文档映射到多个预先定义好的主题中,语音分类是语音识别的一个重要研究方向,具有广泛的应用前景,得到人们越来越多的关注。伴随着多媒体时代的到来,汉语言文档分类技术的研究变得必不可少。 针对这一现状,本文从构建汉语音文档分类系统出发,利用HTK平台将语音文档识别成one-best单候选和lattice多候选两种结构,并结合传统文本分类思想,将4个类别8700多个语音片段合并为748个语音文档的训练测试集,实现了语音文档的主题分类。 该分类系统以单候选one-best分类系统为基线系统,与多候选lattice分类系统相对比。在基线系统中,以传统的文本分类系统为框架。而在多候选分类系统中,用混淆网络对lattice进行结构优化,并且在混淆网络的结构上基于词片进行词汇的提取。该方法采用混淆网络为分类的中间结构,突出了多候选之间的竞争关系,避免了传统方法因寻找识别结果中的最优路径而带来的误差,以保证分类的正确。并且后验概率的引入能够有效地减小了识别误差对分类效果的影响。分类器设计部分采用当前经典的奇异值分解方法,构建了类中心分类器。实验表明,与单侯选分类系统相比,引入混淆网络的多候选分类系统能提供更多的竞争候选,在特征项向量稀疏的情况下,具有更好的分类性能。
【学位授予单位】:哈尔滨工程大学
【学位级别】:硕士
【学位授予年份】:2010
【分类号】:TN912.3

手机知网App
【引证文献】
中国硕士学位论文全文数据库 前1条
1 陈国兴;基于音节片Lattice的语音检索关键问题研究[D];哈尔滨工程大学;2012年
【参考文献】
中国期刊全文数据库 前4条
1 郑铁然;韩纪庆;;基于后验概率的汉语语音检索方法研究[J];高技术通讯;2009年02期
2 曹玉东;;语音识别中的搜索策略研究[J];攀枝花学院学报;2007年03期
3 郑铁然;韩纪庆;李海洋;;基于词片的语言模型及在汉语语音检索中的应用[J];通信学报;2009年03期
4 郑铁然;韩纪庆;;基于音节Lattice的汉语语音检索技术及其索引去冗余方法[J];声学学报(中文版);2008年06期
【共引文献】
中国期刊全文数据库 前10条
1 罗云贵;张友纯;;嵌入式语音门禁系统的设计与实现[J];安防科技;2010年02期
2 张道信,周爱毓;语音信号实时降噪软件的设计[J];安徽大学学报(自然科学版);2004年04期
3 相征;朗朗;王静;;基于基音频能值的端点检测算法[J];安徽工程科技学院学报(自然科学版);2008年03期
4 时雷;虎晓红;席磊;段其国;;集成学习技术在农业中的应用[J];安徽农业科学;2008年26期
5 时雷;席磊;虎晓红;段其国;;基于支持向量机的农业数据分类研究[J];安徽农业科学;2009年05期
6 时雷;虎晓红;席磊;;基于Naive Bayes算法的大豆病害诊断研究[J];安徽农业科学;2009年11期
7 吕军;马晓娜;;汉语孤立词声韵分割算法的研究[J];安徽师范大学学报(自然科学版);2008年03期
8 刘晓志;黄厚宽;尚文倩;;带专业词库的特征选择[J];北京交通大学学报;2006年02期
9 王晖;颜靖华;李传珍;蔡娟娟;;音频贝叶斯谐波模型中参数的提取[J];中国传媒大学学报(自然科学版);2007年04期
10 孔令志;罗森林;张冰;王耀威;;纯音乐与语音-音乐混合片段的高准确识别方法[J];北京理工大学学报;2009年01期
中国重要会议论文全文数据库 前10条
1 徐晨;曹辉;;一种语音信号生成的数字模型的研究[A];第二届西安-上海两地声学学术会议论文集[C];2011年
2 哈妮克孜·伊拉洪;帕力旦·赛力提尼牙孜;那斯尔江·吐尔逊;吾守尔·斯拉木;;维吾尔人说汉语普通话发音特点的声学分析[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年
3 闵刚;蒋永生;杨吉斌;张雄伟;;分段声码器中的语音分段算法研究[A];第十三届全国信号处理学术年会(CCSP-2007)论文集[C];2007年
4 张骞;徐俊佳;;基于SPCE061A的声控车库门的设计[A];河南省土木建筑学会2010年学术大会论文集[C];2010年
5 王浩;宋巍;岳振军;;语音信号的傅立叶-贝赛尔展开及其特性初探[A];全国第一届嵌入式技术联合学术会议论文集[C];2006年
6 闫佩君;陈亮;;基于小波高频分形维数的语音隐藏方法[A];第一届建立和谐人机环境联合学术会议(HHME2005)论文集[C];2005年
7 侯松;周斌;贾焰;;分词结果的再搭配对文本分类效果的增强[A];全国计算机安全学术交流会论文集(第二十四卷)[C];2009年
8 朱艳辉;王平;周咏梅;;一种基于Agent的中文Web信息自动检索系统(英文)[A];2006年全国开放式分布与并行计算机学术会议论文集(三)[C];2006年
9 冯朝斌;吕成国;赵洪刚;;话者识别系统改进策略的研究[A];黑龙江省计算机学会2009年学术交流年会论文集[C];2010年
10 王建波;林本浩;田春明;刘睿;;语音增强及其相关技术研究[A];2009通信理论与技术新发展——第十四届全国青年通信学术会议论文集[C];2009年
中国硕士学位论文全文数据库 前10条
1 王丽敬;地理案例的空间相似性计算[D];山东科技大学;2010年
2 吕万里;中文文本分类技术研究[D];山东科技大学;2010年
3 楼侃;基于DSP的语音信号环境噪声降噪处理技术的研究[D];长春理工大学;2010年
4 靳志强;报告厅环境下语音增强方法研究[D];郑州大学;2010年
5 曹唯伟;基于拼音编码的水下语音通信发射端的设计与实现[D];哈尔滨工程大学;2010年
6 刘继芳;基于计算听觉场景分析的混合语音分离研究[D];哈尔滨工程大学;2009年
7 徐雯;VDR音频数据数字水印算法研究[D];哈尔滨工程大学;2010年
8 王文姝;基于模糊理论的关键词识别算法研究[D];哈尔滨工程大学;2010年
9 刘维巍;语音信号基音周期检测算法研究[D];哈尔滨工程大学;2010年
10 楼佳;基于网络QoS的AMR语音编码算法研究[D];哈尔滨工程大学;2010年
【同被引文献】
中国期刊全文数据库 前10条
1 常凯;;基于TF*IDF垃圾邮件过滤改进算法的研究[J];电脑知识与技术;2010年25期
2 张仰森,徐波,曹元大;自然语言处理中的语言模型及其比较研究[J];广西师范大学学报(自然科学版);2003年01期
3 饶耀全;吴小培;吕钊;;基于HTK的汉语语音售票系统的设计与实现[J];工业控制计算机;2010年10期
4 王欢良;韩纪庆;;基于Lattice分段的高质量混淆网络快速生成方法[J];高技术通讯;2010年05期
5 吴丽华;罗云锋;张宏斌;;信息检索模型及相关性算法的研究[J];情报杂志;2006年12期
6 孟莎;余鹏;Frank Seide;刘加;;基于后验概率词格的汉语自然对话语音索引[J];清华大学学报(自然科学版);2008年S1期
7 吴斌;刘刚;郭军;;汉语大词汇量连续语音识别中混淆网络算法的研究[J];四川大学学报(工程科学版);2007年S1期
8 郑铁然;韩纪庆;李海洋;;基于词片的语言模型及在汉语语音检索中的应用[J];通信学报;2009年03期
9 石现峰;张学智;张峰;;基于HTK的语音识别系统设计[J];计算机技术与发展;2006年10期
10 吴丹;齐和庆;;信息检索模型及其在跨语言信息检索中的应用进展[J];现代情报;2009年07期
中国硕士学位论文全文数据库 前10条
1 高运霞;基于网格的中文语音文件检索技术的研究[D];哈尔滨工程大学;2010年
2 刘建舟;术语自动抽取系统的设计及关键技术研究[D];华中师范大学;2004年
3 侯周国;基于HMM的汉语数字语音识别系统研究[D];湖南师范大学;2006年
4 郑毅;文本挖掘及其在文本检索中的应用[D];中国科学院研究生院(计算技术研究所);2002年
5 苏敏;一种基于HMM和RBF网络混合的语音识别算法研究[D];兰州理工大学;2007年
6 刘洋;基于最佳状态数的汉语数字语音识别系统的研究与实现[D];北京邮电大学;2008年
7 项勇;基于DSP和HMM的语音识别系统设计与实现[D];武汉科技大学;2008年
8 李海洋;基于词片和Lattice的汉语语音检索技术研究[D];哈尔滨工业大学;2007年
9 蒋斌;基于停用词处理的汉语语音检索方法[D];哈尔滨工业大学;2008年
10 蒋鑫;语音关键词识别技术的研究及应用[D];北京邮电大学;2009年
【二级参考文献】
中国期刊全文数据库 前5条
1 张东滨,杜利民;语音识别的自适应束剪枝方法[J];电声技术;2004年08期
2 朱璇,陈一宁,刘加,刘润生;语音识别片上系统中的多级搜索算法[J];电子学报;2004年01期
3 陈景东,姚磊,黄泰翼;几种高鲁棒性通道及说话人自适应语音识别算法研究[J];声学学报;1998年06期
4 郝杰,李星;汉语连续语音识别中关键词可信度的贝叶斯估计[J];声学学报;2002年05期
5 王欢良;韩纪庆;李海峰;;基于特征似然度加权和维数缩减的Robust语音端点检测[J];声学学报(中文版);2007年01期
【相似文献】
中国期刊全文数据库 前10条
1 沈建苗;让语音搭乘WLAN[J];微电脑世界;2003年21期
2 侯勖;IP传语音 无线更通畅[J];微电脑世界;2000年35期
3 曾擎宇;声硕语音──中国人自己的语音科技[J];电声技术;1999年11期
4 兰亦翎;用语音操作WPS2000[J];微电脑世界;1999年22期
5 成奋华;吴家强;;数字图书馆中基于向量空间模型的文档分类系统[J];上海高校图书情报工作研究;2004年02期
6 黄萱菁;吴立德;;基于向量空间模型的文档分类系统[J];模式识别与人工智能;1998年02期
7 陈恩红,张振亚,合源一幸,王煦法;基于扩展角分类神经网络的文档分类方法(英文)[J];软件学报;2002年05期
8 秋实;语音互联网前景[J];通信世界;2002年24期
9 孙慧;联通手机语音导航助你畅游天下[J];通信世界;2005年36期
10 张卫丰;徐宝文;崔自峰;徐峻岭;;一种基于粗糙集角分类神经网络的文档分类方法(英文)[J];东南大学学报(英文版);2006年03期
中国重要会议论文全文数据库 前10条
1 陈肖霞;;频谱平衡在语音中作用的研究[A];新世纪的现代语音学——第五届全国现代语音学学术会议论文集[C];2001年
2 朱春跃;;北京话的语音脱落[A];新世纪的现代语音学——第五届全国现代语音学学术会议论文集[C];2001年
3 丁丹;许斌;;基于ADAU1361和CycloneⅣ的语音接口及AGC的实现[A];2010通信理论与技术新发展——第十五届全国青年通信学术会议论文集(下册)[C];2010年
4 裴军;崔君霞;施浒立;;基于转发式卫星导航的极低速率语音通信系统设计[A];第二届中国卫星导航学术年会电子文集[C];2011年
5 徐以中;Akira Toyomura;Sachiko Koyama;Shinya Kuriki;;语音听觉反馈对言语发声的影响[A];第十二届全国心理学学术大会论文摘要集[C];2009年
6 郑秋豫;;神经语言学与语音工程[A];第六届全国人机语音通讯学术会议论文集[C];2001年
7 任桂琴;韩玉昌;;句子语境中汉语词汇语音作用的ERP研究[A];第十一届全国心理学学术会议论文摘要集[C];2007年
8 王莉;崔效义;李敬阳;冯祖祎;;方言性伪装语音的声学特征研究[A];新世纪的现代语音学——第五届全国现代语音学学术会议论文集[C];2001年
9 倪素萍;张建平;颜永红;吕士楠;;语音音色变换的现有技术分析[A];第七届全国人机语音通讯学术会议(NCMMSC7)论文集[C];2003年
10 孙晋明;;语音液位测量仪在万年闸枢纽上的应用[A];中国航海学会船闸专业委员会2006年论文汇编[C];2006年
中国重要报纸全文数据库 前10条
1 谢佳 许勋磊;语音自动回访连民心[N];人民公安报;2009年
2 合文;114变身语音搜索引擎 欲叫板Google、百度[N];中国计算机报;2006年
3 晓芳;寻找语音增值前进的“指南针”[N];国际商报;2005年
4 ;《双语学习语音读本》首发[N];新疆日报(汉);2009年
5 黄海虹;把号码百事通打造成语音Google[N];人民邮电;2006年
6 彭泽润;“做”和“作”是多余的文字区分[N];语言文字周报;2005年
7 甘信建 卢向前 章娴;成都“联通手机语音导航”路演反响好[N];人民邮电;2006年
8 甘肃 张晓东;汽车转弯语音告知器[N];电子报;2007年
9 何文;让语音114知百事 通天下[N];科技日报;2009年
10 记者 井波;新疆大学讯飞语音及语言联合实验室成立[N];新疆日报(汉);2010年
中国博士学位论文全文数据库 前10条
1 秀花;卡尔梅克语与蒙古语比较研究[D];内蒙古大学;2007年
2 崔淑慧;山西北区方言语音研究[D];暨南大学;2004年
3 张燕来;兰银官话语音研究[D];北京语言文化大学;2003年
4 李旭;河北省中部南部方言语音研究[D];山东大学;2008年
5 汪云路;语音隐藏分析方法研究[D];中国科学技术大学;2008年
6 邓享璋;闽北、闽中方言语音研究[D];厦门大学;2007年
7 刘新中;海南闽语的语音研究[D];暨南大学;2004年
8 李星辉;湘南土话与湘南瑶语的接触和影响[D];湖南师范大学;2004年
9 李建校;陕北晋语语音研究[D];北京语言大学;2006年
10 汪如东;汉语方言的语音差异对修辞的影响[D];复旦大学;2003年
中国硕士学位论文全文数据库 前10条
1 陈晶;基于词片网格的语音文档主题分类[D];哈尔滨工程大学;2010年
2 赵祎缺;桂南平话语音历史层次研究[D];广西大学;2004年
3 张世勇;电信计费系统中语音业务系统设计与实现[D];吉林大学;2005年
4 林琼;临澧方言语音研究[D];湖南师范大学;2006年
5 董青;威海方言初探[D];苏州大学;2008年
6 徐宏;语音盲分离算法及应用的研究[D];太原理工大学;2011年
7 魏超;项目管理在语音天地平台项目中的应用研究[D];北京邮电大学;2010年
8 孙宁;中国网通广东分公司[D];暨南大学;2003年
9 陆仲辉;实时通信与VoIP技术研究及实现[D];山东大学;2005年
10 余璐;《说文解字》楚方言词研究[D];安徽大学;2007年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026