收藏本站
《南京理工大学》 2009年
收藏 | 手机打开
二维码
手机客户端打开本文

基于条件随机场的口语规范化处理研究

徐波  
【摘要】: 自然人机接口是计算机能否受到更广泛应用的关键技术。语音翻译是自然人机接口的典型应用,目前已经取得了一些成果,但仍存在许多问题有待进一步研究。尤其是由于自然口语本身的灵活性与多变性,导致其中的重复、冗余、省略等非规范化现象大量存在,加上在语音识别阶段无法完全避免的识别错误结果,这些都对语音翻译系统的后续处理过程产生了很大的影响,进而使得翻译质量低下。本文以条件随机场模型(Conditional Random Fields Model)为基础,开展对语音识别后的自然口语规范化及纠错处理(下文简称为口语规范化处理)的研究,主要工作和特点如下: 1、详细介绍了条件随机场模型的理论及其对自然语言处理的重要意义,分析并比较了该模型相对于其它序列标注统计模型的优点。 2、根据语音翻译系统目前存在的问题,专门开展了对自然口语中存在的非规范化现象及语音识别错误纠正问题的研究。 3、采用了规则与统计结合的方法应用于本问题的处理。根据自然口语的特点,本文总结归纳了一些可以利用的语言规则。规则的引入解决了单纯基于统计方法存在的一些弊端。实验结果表明,这种方法比单纯基于统计的方法效果要好。 4、设计编程实现了条件随机场模型,解决了现有的模型实现工具存在的内存需求过大的问题,也免除了使用现有工具时的中间环节,从而大幅度提高了工程效率。 5、利用现有的语料库,设计了一个完整的实验系统。通过实验结果表明,基于条件随机场模型的口语规范化处理效果良好。
【学位授予单位】:南京理工大学
【学位级别】:硕士
【学位授予年份】:2009
【分类号】:TP391.2

【引证文献】
中国博士学位论文全文数据库 前1条
1 王峰;美尔音级轮廓特征在音乐和弦识别算法中的应用研究[D];太原理工大学;2010年
【参考文献】
中国期刊全文数据库 前10条
1 周俊生;戴新宇;尹存燕;陈家骏;;基于层叠条件随机场模型的中文机构名自动识别[J];电子学报;2006年05期
2 史庆伟;赵政;鲍虎;;基于条件随机域的Web信息抽取[J];辽宁工程技术大学学报;2007年04期
3 姜维;关毅;王晓龙;;基于条件随机域的词性标注模型[J];计算机工程与应用;2006年21期
4 周俊生;戴新宇;尹存燕;陈家骏;;自然语言信息抽取中的机器学习方法研究[J];计算机科学;2005年03期
5 刘智博;Michael Brasser;郑方;徐明星;;一个基于文本输入的口语对话系统的新的实现策略[J];计算机科学;2006年11期
6 李素建,刘群,杨志峰;基于最大熵模型的组块分析[J];计算机学报;2003年12期
7 张华平,刘群;基于角色标注的中国人名自动识别研究[J];计算机学报;2004年01期
8 马健,张珏成;对机器自然语言理解本质的认识[J];宁夏大学学报(自然科学版);2003年03期
9 江铭虎,朱小燕,袁保宗;一种适应域的汉语N-gram语言模型平滑算法[J];清华大学学报(自然科学版);1999年09期
10 杨家沅,林道发,罗万伯,苟大举,贺德珏,施鸿宝,龚青;连续英汉语音翻译系统的设计和实现[J];声学学报;1992年05期
【共引文献】
中国期刊全文数据库 前10条
1 张小燕;普通话上声变调与轻声分析[J];阿坝师范高等专科学校学报;2004年02期
2 杨晓黎;;传承语素:汉语语素分析的新视角[J];安徽大学学报(哲学社会科学版);2012年02期
3 王有卫;;语素文字说质疑[J];安徽广播电视大学学报;2010年03期
4 陈维友;蔡文娟;;韵律对英语诅咒插入语和汉语离合词表达的制约作用[J];安徽电子信息职业技术学院学报;2009年03期
5 熊仲儒;;致使的语音实现及其句法蕴含[J];安徽师范大学学报(人文社会科学版);2005年06期
6 熊仲儒;;汉语中无定主语的允准条件[J];安徽师范大学学报(人文社会科学版);2008年05期
7 熊仲儒;;领属性致使句的句法分析[J];安徽师范大学学报(人文社会科学版);2012年03期
8 徐文莉;;基于最大熵方法的DaR风险度量模型[J];安徽师范大学学报(自然科学版);2007年01期
9 严芳;;浅谈对外汉语中离合词的教学[J];安徽文学(下半月);2008年04期
10 薛凤生;;动补结构否定形式小议[J];安徽文学(下半月);2008年08期
中国重要会议论文全文数据库 前10条
1 于江德;王希杰;樊孝忠;;汉语词法分析中上文和下文孰重孰轻[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
2 何正焱;王厚峰;;商品品牌名称挖掘[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
3 徐赳赳;;现代汉语篇章中启后性分析[A];和谐社会:社会建设与改革创新——2007学术前沿论丛(下卷)[C];2007年
4 李影;付莉;;韩国中小学生“是”的错序偏误分析[A];语言与文化研究(第四辑)[C];2009年
5 郑述谱;;语言单位与词典的类型及结构[A];中国辞书学会双语词典专业委员会第四届年会暨学术研讨会论文集[C];2001年
6 刘建梅;;关于编纂外向型汉外字典的设想[A];中国辞书学会双语词典专业委员会第五届年会暨学术研讨会论文集[C];2003年
7 王周宏;;符号几何规划的全局解方法[A];中国运筹学会第七届学术交流会论文集(上卷)[C];2004年
8 刘中意;孙文瑜;;大型有界约束最优化问题的子空间有限存储BFGS算法(英文)[A];中国运筹学会第九届学术交流会论文集[C];2008年
9 李在禾;;等式约束优化的一个子空间算法的下降性质(英文)[A];中国运筹学会第九届学术交流会论文集[C];2008年
10 田野;;北京话强调焦点句音量分析[A];第九届中国语音学学术会议论文集[C];2010年
中国博士学位论文全文数据库 前10条
1 邱闯仙;现代汉语插入语研究[D];南开大学;2010年
2 吴善子;汉韩反诘语气副词对比研究[D];上海外国语大学;2010年
3 李红梅;韩国语范围表达研究[D];上海外国语大学;2010年
4 李建平;面向异构数据源的网络安全态势感知模型与方法研究[D];哈尔滨工程大学;2010年
5 姚文琳;汉语依存句法分析方法的研究与实现[D];中国海洋大学;2009年
6 刘春兰;《训世评话》语法研究[D];南开大学;2010年
7 李秉震;汉语话题标记的语义、语用功能研究[D];南开大学;2010年
8 郭红;基于第二语言教学的汉语语气范畴若干问题研究[D];南开大学;2010年
9 刘艳红;唐五代方位词研究[D];南开大学;2010年
10 董正存;汉语全称量限表达研究[D];南开大学;2010年
中国硕士学位论文全文数据库 前10条
1 赵桂阳;现代汉语“不是X的X”结构考察[D];哈尔滨师范大学;2010年
2 马晶晶;表人名词类词缀“X手”、“X者”、“X员”分析比较[D];辽宁师范大学;2010年
3 顾倩;现代汉语否定副词“不”“没(没有)”“别”的对比研究[D];辽宁师范大学;2010年
4 张军珲;基于统计的常用汉语副词用法自动识别研究[D];郑州大学;2010年
5 宗政;2009年中国政府工作报告翻译对比研究[D];上海外国语大学;2010年
6 陶胜妃;现代汉语谓词修饰词前后位置比较研究[D];上海外国语大学;2010年
7 丁熠;“契合”类语气副词研究[D];上海外国语大学;2010年
8 刘金宁;词性标注体系对中文分词的影响[D];大连理工大学;2010年
9 王东亮;基于条件随机场模型的中文人名识别的研究[D];大连理工大学;2010年
10 安波;基于蛋白质关系网络的蛋白质络合物抽取研究[D];大连理工大学;2010年
【同被引文献】
中国期刊全文数据库 前10条
1 于拾全;景新幸;刘志国;;乐器音高检测方法的比较和精度分析[J];电声技术;2006年07期
2 吴晶晶;孟玲玲;;乐音音符基频识别[J];电子测量技术;2009年04期
3 周俊生;戴新宇;尹存燕;陈家骏;;基于层叠条件随机场模型的中文机构名自动识别[J];电子学报;2006年05期
4 刘丹,张乃尧,朱汉城;音乐特征识别的研究综述[J];计算机工程与应用;2002年24期
5 许琳,王作英;基于HMM的音乐识别算法[J];计算机工程;2004年10期
6 罗强;李瑞浴;易东云;;基于模糊文化算法的自适应粒子群优化[J];计算机工程与科学;2008年01期
7 李功宇,郑华文,胡持平;弦乐合弦声信号时频特征的小波包分析[J];昆明理工大学学报(理工版);2003年04期
8 张阿卜;利用BP算法的一种自适应模糊预测控制器[J];控制理论与应用;1999年01期
9 刘国荣;模型参考模糊自适应控制[J];控制理论与应用;1996年01期
10 褚一平;张引;叶修梓;张三元;;基于隐条件随机场的自适应视频分割算法[J];自动化学报;2007年12期
中国博士学位论文全文数据库 前1条
1 雷震春;支持向量机在说话人识别中的应用研究[D];浙江大学;2006年
中国硕士学位论文全文数据库 前6条
1 马俊;语音识别技术研究[D];哈尔滨工程大学;2004年
2 徐国庆;乐音识别技术研究及应用[D];重庆大学;2004年
3 陈廷梁;音乐结构分析及应用[D];哈尔滨工业大学;2006年
4 王志强;基于条件随机域的中文命名实体识别研究[D];南京理工大学;2006年
5 冯铮;模糊神经网络在音乐识别中的应用[D];上海海事大学;2007年
6 刘林;自动音乐识谱系统中的音符检测与流派分类[D];电子科技大学;2008年
【二级引证文献】
中国期刊全文数据库 前1条
1 闫志勇;关欣;李锵;;基于SVM和增强型PCP特征的和弦识别[J];计算机工程;2014年07期
中国博士学位论文全文数据库 前1条
1 黄丽霞;非特定人鲁棒性语音识别中前端滤波器的研究[D];太原理工大学;2011年
中国硕士学位论文全文数据库 前3条
1 陈雨;基于Key-dependent HMM的音乐和弦识别系统[D];吉林大学;2011年
2 郑晓平;基于HMM-ANN混合模型的咳嗽音识别研究[D];重庆大学;2011年
3 田犇;基于FPGA孤立词语音识别系统设计与实现[D];武汉理工大学;2012年
【二级参考文献】
中国期刊全文数据库 前10条
1 郭艳华,周昌乐;自然语言理解研究综述[J];杭州电子工业学院学报;2000年01期
2 屈刚,陆汝占;基于特征的汉语词性标注模型[J];计算机研究与发展;2003年04期
3 黄河燕,陈肇雄;基于多策略的交互式智能辅助翻译平台总体设计[J];计算机研究与发展;2004年07期
4 刘群,张华平,俞鸿魁,程学旗;基于层叠隐马模型的汉语词法分析[J];计算机研究与发展;2004年08期
5 赵岩;王晓龙;刘秉权;关毅;;融合聚类触发对特征的最大熵词性标注模型[J];计算机研究与发展;2006年02期
6 胡春静,韩兆强;基于隐马尔可夫模型(HMM)的词性标注的应用研究[J];计算机工程与应用;2002年06期
7 侯国峰;一个自然语言理解系统的设计和实现[J];计算机应用研究;2001年02期
8 吕雅娟,赵铁军,杨沐昀,于浩,李生;基于分解与动态规划策略的汉语未登录词识别[J];中文信息学报;2001年01期
9 张华平,刘群;基于N-最短路径方法的中文词语粗分模型[J];中文信息学报;2002年05期
10 张孝飞,陈肇雄,黄河燕,蔡智;词性标注中生词处理算法研究[J];中文信息学报;2003年05期
中国重要会议论文全文数据库 前1条
1 季姮;罗振声;;基于反比概率模型和规则的中文姓名自动辨识系统[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
【相似文献】
中国期刊全文数据库 前10条
1 罗亮;邵泽辉;;基于条件随机场进行蛋白质二级结构预测[J];计算机应用研究;2009年03期
2 宗萍;施水才;王涛;吕学强;;基于条件随机场的英文地理行政实体识别[J];现代图书情报技术;2009年02期
3 张开旭;夏云庆;宇航;;基于条件随机场的古汉语自动断句与标点方法[J];清华大学学报(自然科学版);2009年10期
4 成姣;蔡东风;季铎;;基于条件随机场的日语依存分析[J];沈阳航空工业学院学报;2010年05期
5 李玲玲;金泰松;李翠华;;基于局部特征和隐条件随机场的场景分类方法[J];北京理工大学学报;2012年07期
6 宁伟;蔡东风;张桂平;季铎;苗雪雷;;基于条件随机场的冠词选择研究[J];中文信息学报;2008年06期
7 张玉芳;莫凌琳;熊忠阳;耿晓斐;;基于条件随机场的科研论文信息分层抽取[J];计算机应用研究;2009年10期
8 王昌厚;;基于条件随机场的中文命名体识别[J];福建电脑;2012年02期
9 施水才;王锴;韩艳铧;吕学强;;基于条件随机场的领域术语识别研究[J];计算机工程与应用;2013年10期
10 王东波;陈小荷;年洪东;;基于条件随机场的有标记联合结构自动识别[J];中文信息学报;2008年06期
中国重要会议论文全文数据库 前5条
1 王东波;陈小荷;年洪东;;基于条件随机场的有标记联合结构自动识别[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
2 张奇;翁富良;黄萱菁;吴立德;;英文口语中非流利区域的检测[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
3 魏玮;杜金华;徐波;;基于分层语块分析的统计翻译研究[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
4 王根;赵军;;基于多重冗余标记CRF的句子情感分析研究[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
5 宁伟;蔡东风;季铎;;基于条件随机场的冠词选择研究[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
中国博士学位论文全文数据库 前1条
1 熊英;中文自然语言理解中基于条件随机场理论的词法分析研究[D];上海交通大学;2009年
中国硕士学位论文全文数据库 前10条
1 王鸿飞;基于条件随机场的中文微博情感分析研究[D];广东工业大学;2013年
2 虞海明;基于三阶条件随机场的元数据提取方法[D];燕山大学;2013年
3 陶玮;基于条件随机场和关联分析的场景分类[D];上海交通大学;2013年
4 姜锋;基于条件随机场的中文分词研究[D];大连理工大学;2006年
5 张瑜;基于条件随机场的目标检测方法研究[D];西安电子科技大学;2014年
6 莫凌琳;基于条件随机场的科研论文信息分层抽取研究[D];重庆大学;2009年
7 曹锦;条件随机场在基因剪接位点预测中的应用研究[D];福建农林大学;2012年
8 曾佳妮;基于条件随机场的中文短文本分类算法研究[D];上海交通大学;2013年
9 陈晴;基于条件随机场的自动分词技术的研究[D];东北大学;2005年
10 罗恒;应用条件随机场进行汉语词法分析、语块分析研究[D];兰州理工大学;2006年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026