收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

汉语口语对话系统中口语语言分析

张琳  
【摘要】: 在当今信息时代,人机口语对话系统有着广泛的应用需求。口语语言中包含有大量的省略、停顿、重复、自我纠错以及不合语法的现象等,因此在汉语人机口语对话中,口语语言的分析理解是人机对话系统实现的关键和难点。现在的口语对话系统语言的分析处理方法大多采用模板匹配处理方法,然而口语语言的灵活性使得模板数量过于庞大,而且导致系统准确性不高。本文着重研究汉语口语对话系统中的口语语言分析,尝试用内涵概念分析的思想,把对语言的分析上升到概念层次上进行分析来解决该问题。本文研究工作背景来源于上海市科委科技项目限定领域口语对话系统——交通领域口语对话系统SHJTQ, SHJTQ提供上海市任意两个地点之间、在不同的交通方式(步行、自行车、出租车、公交车)下的交通路线信息的查询。 目前限定领域的口语语言分析理解的方法大致可以分为两类:概率统计方法和规则分析方法。概率统计分析技术主要基于语言结构的统计特性,缺乏智能性和可靠性。规则分析方法又分为逻辑分析方法和概念分析方法两类。逻辑分析方法以蒙太古的语义学为代表,用模型论来表示片断英语的语义,但要处理真实文本、全面地解释汉语语义,仍然感到逻辑分析的局限性。概念分析是后继的逻辑学家维特根斯坦、奥斯汀、塞尔这些哲学家提出的,语言哲学家以及心理哲学家关心的是有关心理、感觉、情感一类词汇的概念分析,但不注重对于指称实体的词类及其概念的研究。 现在的口语对话系统都是在应用层面进行语言的分析处理,提出的解决方法大多采用字串匹配的方法或是在字串匹配的基础上加入一些处理方法。这种分析方法最大的缺点就是字串不同或字串次序变化,分析就会失败。因此无法解释灵活多变的口语语言。本文提出了内涵概念分析的思想,把对语言的分析上升到概念层次上进行分析,口语语言虽然灵活多变,但表达的概念是一样的,从而解决了模板匹配解决不了的问题。 从实现角度讲,除音调外一字符串(如短语、句)的语音要用1K数据存储空间,对通常对话的语音处理将占用超大量存储空间。如果改为一汉字一模板,两千常用汉字的语音信息共2K*1K数据,利用汉语是字组合表达概念直接耦合的优点,将字语音模板作为单位,字组合即为语音模板信息组合,可大大减少语音数据,为语音对话使用开创了可行前景。可不限用户使用规定的表达格式、模板可自由表达。但由此带来语言处理的复杂性和重要性。本文充分利用汉语概念内涵模型思想,实现了专用领域内对话词语的概念分析,并获成功。 本文研究了SHJTQ中词汇(主要是交通工具类词汇)的内涵特征,提出了名词具有“定义特征”和“情景区分特征”两个概念。在不同语境下,词汇的凸现特征(情景区分特征)有所不同。提出用一种“E—A-V”(实体-属性-值)的方法表征名词的概念。本文研究了SHJTQ中用户问句,针对用户问句多为疑问句的特点,借助言语行为理论的思想,对SHJTQ系统用户查询问句进行了言语行为分类。分析研究了SHJTQ口语语句的内涵概念,根据用户查询问题的分类,逐个将各类用户查询例句了进行概念分析,解决了字串匹配不能解决的口语语言中的各种变异现象,为汉语口语语言的理解研究提供新的思路。 本文介绍了限定领域对话系统口语语言的概念分析方法在SHJTQ中的具体应用。着重分析了SHJTQ语言分析模块的设计等,同时本文给出了系统的测试结果和分析。 本文研究的创新点主要在如下几方面: 1.用概念分析的方法分析汉语口语语言,有别于传统的应用层面上的字串匹配分析方法。从概念层面分析解释了SHJTQ中口语语言,解释了口语语言在形式上灵活多变,但表达的是同一概念。另外采用概念分析方法,汉语和其他语言(如英语等)在体态(形态、时态等)方面的差别就会退化,有助于实现多语种的口语对话。第三,在具体实现方面,有了口语语言的概念分析,语音识别需要的模板量就可以大大减少,可以推进口语对话系统的发展。 2.采用“E—A-V”(实体-属性-值)的表示概念语义模型,表征了名词的多义性。本文采用的是陆汝占先生的内涵逻辑分析即概念分析的基本思想,即对一个词语所表示的概念进行分解,求解出上位概念、下位区分概念、定义属性特征以及扩展特征;解释了词语、指称实体、概念三者关系。认为名词是指称实体的词语项,实体包括物理实体和抽象实体两类。名词具有内涵性质即语义特征,提出了“定义特征”和“情景区分特征”两个概念。分析了SHJTQ中词汇(主要是交通工具类名词词汇)的内涵特征,将内涵特征理论引入到汉语语言研究,通过内涵特征来解释纷纭复杂的汉语语义是一个新尝试。 3.用内涵概念分析的方法研究了SHJTQ口语语句,根据用户查询问题的言语行为分类,逐个将各类用户查询例句进行概念分析,分析了简单完备用户表述语句、带变异的表述、不完备表述语句,把用户不规范的表达转变成概念层次上规范的查询表达,从而解决了字串匹配无法解决的口语语言灵活表达的问题。实现了概念分析指导下的限定领域口语对话系统。经测试,系统准确性较高。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 张波,蔡庆生,郭百宁;口语对话系统的POMDP模型及求解[J];计算机研究与发展;2002年02期
2 王彬,江铭虎;口语对话系统中的语句主题提取[J];计算机工程与应用;2004年18期
3 陈俊燕,吴及,王侠,王作英;口语对话系统中的一种稳健语言理解算法[J];清华大学学报(自然科学版);2005年01期
4 黄寅飞,郑方,燕鹏举,徐明星,吴文虎;校园导航系统Easy Nav的设计与实现[J];中文信息学报;2001年04期
5 王菁华,钟义信,王枞,刘建毅;口语对话管理综述[J];计算机应用研究;2005年10期
6 汪志鸿;张海云;陈柯;杜利民;;语音浏览器的概念、框架和应用[J];微计算机应用;2007年10期
7 郭书杰;黄明;梁旭;;陪护机器人口语对话系统设计与实现[J];网络安全技术与应用;2010年12期
8 燕鹏举,郑方;口语对话系统中的词类概率模型和知识表示[J];清华大学学报(自然科学版);2001年01期
9 黄寅飞,郑方,苏毅,李芳,徐明星,吴文虎;口语对话系统EasyNav中的省略分析[J];清华大学学报(自然科学版);2002年01期
10 汪志鸿;于水源;杜利民;;使用期待提高对话系统的语音识别率[J];黑龙江大学自然科学学报;2006年01期
11 茹海波,单翼翔,刘加,刘润生;智能熊猫口语对话系统[J];计算机工程与应用;2003年02期
12 刘智博;Michael Brasser;郑方;徐明星;;一个基于文本输入的口语对话系统的新的实现策略[J];计算机科学;2006年11期
13 张合;邬晓钧;王晓东;郑方;;一种基于句子分割的文法自动推导算法[J];清华大学学报(自然科学版);2009年S1期
14 孙辉;郑方;吴文虎;;基于上下文相关置信度打分的语音确认方法[J];清华大学学报(自然科学版);2006年01期
15 刘蓓,杜利民;汉语口语对话系统中语义分析的消歧策略[J];中文信息学报;2005年01期
16 吴尉林;陆汝占;段建勇;刘慧;高峰;陈玉泉;;基于两阶段分类的口语理解方法[J];计算机研究与发展;2008年05期
17 何伟,李红莲,袁保宗,林碧琴;基于对话回合衰减的cache语言模型在线自适应研究[J];中文信息学报;2003年05期
18 郑方;;汉语口语语言处理的发展趋势[J];国际学术动态;2001年06期
19 张晴晴;潘接林;颜永红;;基于发音特征的汉语普通话语音声学建模[J];声学学报;2010年02期
20 张家騄;人机语言通讯的新进展──Eurospeech’97及其卫星会[J];应用声学;1998年02期
中国重要会议论文全文数据库 前10条
1 邬晓钧;燕鹏举;徐明星;;口语对话系统中日期和时刻的处理[A];第六届全国人机语音通讯学术会议论文集[C];2001年
2 陈俊燕;王作英;;口语对话系统中一种稳健的语言理解算法[A];第七届全国人机语音通讯学术会议(NCMMSC7)论文集[C];2003年
3 李芳;吴文虎;郑方;黄寅飞;苏毅;;口语对话系统中动态查询组织和应答生成的设计[A];第六届全国人机语音通讯学术会议论文集[C];2001年
4 黄寅飞;郑方;苏毅;李芳;吴文虎;;口语对话系统EasyNav中的语义表示[A];第六届全国人机语音通讯学术会议论文集[C];2001年
5 周卫东;袁保宗;朱维彬;;一种新的口语对话系统错误处理方法[A];第九届全国人机语音通讯学术会议论文集[C];2007年
6 燕鹏举;陆正中;邬晓钧;徐明星;吴文虎;方棣棠;;航班信息系统EasyFlight[A];第六届全国人机语音通讯学术会议论文集[C];2001年
7 何伟;袁保宗;林碧琴;;人机对话系统中语音处理的研究[A];第十届全国信号处理学术年会(CCSP-2001)论文集[C];2001年
8 沈扬;袁保宗;李红莲;何伟;;口语火车查询和定票系统性能的评测[A];第七届全国人机语音通讯学术会议(NCMMSC7)论文集[C];2003年
9 初敏;;人机对话系统工程[A];信息科学与微电子技术:中国科协第三届青年学术年会论文集[C];1998年
10 于东;贾磊;徐波;;面向语音识别错误恢复的澄清式人机对话系统[A];第十一届全国人机语音通讯学术会议论文集(二)[C];2011年
中国博士学位论文全文数据库 前2条
1 张琳;汉语口语对话系统中口语语言分析[D];上海交通大学;2008年
2 吴尉林;可移植的稳健口语理解方法研究[D];上海交通大学;2007年
中国硕士学位论文全文数据库 前6条
1 杨聪;基于口语对话的电话自动转接与信息查询技术研究[D];国防科学技术大学;2004年
2 卓佳;基于激励学习的人机口语对话策略优化[D];长沙理工大学;2006年
3 宋德洪;基于儿童心理调适的对话系统研究[D];四川师范大学;2007年
4 陈慧;批评性话语研究[D];湖南农业大学;2012年
5 武元杰;汽车防追尾碰撞主动安全系统关键技术研究[D];山东理工大学;2011年
6 朱敏;英语专业八级口试准备时间长短对考生考试表现的影响[D];南京大学;2012年
中国重要报纸全文数据库 前5条
1 记者 沈路涛;不同语种直接对话为期不远[N];新华每日电讯;2000年
2 苏文彩;浅析体育教学中的语言艺术[N];中华读书报;2004年
3 陶红艳;语境与英语听力教学[N];中国教育资讯报;2002年
4 张玉婷;生物识别技术:安防科技新高度[N];人民公安报;2010年
5 胡琼珍 整理;研发智能机器 破解医学难题[N];健康报;2011年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978