收藏本站
《电子科技大学》 2005年
收藏 | 手机打开
二维码
手机客户端打开本文

汉语语句组块及消歧的研究与实现

周美希  
【摘要】:自然语言处理是语言学、逻辑学、生理学、心理学、计算机科学和数学等相关学科发展和结合而形成的一门交叉学科。自然语言处理的目标就是让计算机能够处理人类语言,并作出人们所期待的各种正确响应,建立起人与机器间密切而友好的关系,以便进行高度的信息传递与认知活动。随着计算机和因特网的推广应用,由数据处理、信息处理发展到知识处理,对语言文字处理要求的深度和广度越来越高,自然语言处理问题已成为了网络社会和网络经济发展的瓶颈。目前自然语言理解的研究仅仅处在让计算机正确理解语言信息的程度上,计算机的智能还远远没有达到能够象人一样理解自然语言的水平。 计算机从诞生之日开始就是以处理印欧语系为基础的,再加上汉语是意形结合的语言,缺乏形态变化,比西方语言复杂,因此计算机处理汉语很困难。为了解决句子的理解问题,计算机必须通过句法分析、语义分析和语境分析得到句子的形式化机内表示。计算机对语言的分析和理解过程是一个层次化的过程,分为词法分析、句法分析和语义分析。目前句法分析使用的方法主要有基于统计的方法、基于规则的方法和采用规则和统计相结合的混合方法。在语义分析上的研究大多是在句法规则的基础上加强语义分析、研制语义信息词典,借助语义特征、语义关系、配价分析等条件识别句子中的各个成分,找到成分之间的结构关系和结构意义。这些方法运用很广,但它们往往会因分裂句法和语义的关系而歧义丛生,造成语句的理解错误。 本文提出一个全新的思路来分析语句和消除层次结构歧义及语义歧义。这个方法突破以往只从句法上分析语句的局限,将句法、语义、语用三个平面结合起来。首先在句法和语义平面利用《知网》和《现代汉语语法信息词典》抽取必要的语法和语义信息构成词汇复杂特征集,再以词汇复杂特征集的功能描述为基础,对语句运用合一运算进行组块。然后在语块内利用CYK算法和《知网-中文信息结构库》改写的CNF进行层次结构消歧和语义消歧。对于无法直接运用该方法消除的歧义,将借助语用平面结合具体的语境进行处理。
【学位授予单位】:电子科技大学
【学位级别】:硕士
【学位授予年份】:2005
【分类号】:TP391.1

手机知网App
【引证文献】
中国期刊全文数据库 前1条
1 朱云;;基于ABNF规则的SIP消息解析模块设计[J];舰船电子工程;2007年06期
中国硕士学位论文全文数据库 前1条
1 李鹏程;概率CYK算法的分析研究[D];太原理工大学;2010年
【参考文献】
中国期刊全文数据库 前6条
1 胡裕树;汉语语法研究的回顾与展望[J];复旦学报(社会科学版);1994年05期
2 李汉威,黄春珍;运用三个平面的理论研究汉语歧义现象[J];江汉大学学报;2001年01期
3 周强,孙茂松,黄昌宁;汉语句子的组块分析体系[J];计算机学报;1999年11期
4 冯志伟;论歧义结构的潜在性[J];中文信息学报;1995年04期
5 董振东;语义关系的表达和知识系统的建造[J];语言文字应用;1998年03期
6 冯志伟;潜在歧义理论用于自然语言处理[J];中文信息;1996年01期
【共引文献】
中国期刊全文数据库 前10条
1 王倩;从复合句零主语指代看汉英语言思维的差异[J];安徽大学学报;2005年05期
2 王德寿;走向成熟和繁荣的现代汉语语法研究——我国(大陆)近20年现代汉语语法研究综[J];安徽广播电视大学学报;1999年04期
3 张大强;;转换生成语法与汉语歧义句的分析[J];安徽文学(下半月);2009年03期
4 赵晓凡;胡顺义;;基于正向最大匹配的汉语分词[J];安阳师范学院学报;2010年05期
5 彭泽润,袁先锋,丘冬;中国20世纪以来关于语言结构的理论研究[J];北华大学学报(社会科学版);2004年02期
6 金纯;浅谈计算机自然语言理解[J];浙江中医学院学报;2005年03期
7 夏天,樊孝忠,刘林,骆正华;基于ALICE的汉语自然语言接口[J];北京理工大学学报;2004年10期
8 赵欣欣;索红光;刘玉树;张利萍;;基于带权语义距离的网页预取方法[J];北京理工大学学报;2006年08期
9 谭咏梅;王小捷;周延泉;钟义信;;使用SVMs进行汉语浅层分析[J];北京邮电大学学报;2008年01期
10 韩玉花;;现代汉语中的“花园小径”现象[J];成都大学学报(教育科学版);2007年02期
中国重要会议论文全文数据库 前10条
1 通拉嘎;赵小兵;;论蒙古语词素切分的实现[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
2 王惠;苏新春;;XHK基于语法知识的汉语词义描述[A];第六届汉语词汇语义学研讨会论文集[C];2005年
3 王治敏;俞士汶;;人称代词和名词的歧义消解研究[A];第六届汉语词汇语义学研讨会论文集[C];2005年
4 魏志成;;汉语句型系统的解构与重构[A];中国英汉语比较研究会第七次全国学术研讨会论文集[C];2006年
5 李优;;支持向量机在组块识别中的应用[A];第八届中国青年运筹信息管理学者大会论文集[C];2006年
6 陈慧清;林世平;;基于知网和模式自举的概念间分类关系获取方法[A];2009通信理论与技术新发展——第十四届全国青年通信学术会议论文集[C];2009年
7 侯敏;;汉语自动分析中的若干问题与对策[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
8 郑旭玲;李堂秋;杨晓峰;陈毅东;;基于语义规则的汉语短语结构分析排歧初探[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
9 冯志伟;;机器翻译系统消歧功能测试[A];机器翻译研究进展——2002年全国机器翻译研讨会论文集[C];2002年
10 周强;;汉语部分分析研究[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
中国博士学位论文全文数据库 前10条
1 吴学忠;跨文化交流背景下音乐融入外语教育的理论与实践研究[D];华东师范大学;2011年
2 舒江波;面向中文信息处理的复句关系词自动标识研究[D];华中师范大学;2011年
3 李荣军;中文商品评论倾向性分析研究[D];北京邮电大学;2011年
4 刘朝涛;中文问答系统中的句型理论及其应用研究[D];重庆大学;2010年
5 郭鸿志;多源语义知识库融合方法研究[D];哈尔滨工业大学;2011年
6 白莲花;韩汉语语序类型对比研究[D];上海外国语大学;2011年
7 王迈;语言形式化原理[D];上海外国语大学;2011年
8 何婷婷;语料库研究[D];华中师范大学;2003年
9 宋春阳;面向信息处理的现代汉语“名+名”逻辑语义研究[D];上海师范大学;2003年
10 张蕾;概念结构及其应用[D];西北工业大学;2001年
中国硕士学位论文全文数据库 前10条
1 刘洋;基于本体的医保审计知识库构建研究[D];哈尔滨工程大学;2010年
2 吕韶华;面向中文评论文本的情感倾向性研究[D];大连理工大学;2010年
3 邢鑫岩;基于序列模型的情感分析研究[D];大连理工大学;2010年
4 龚晶晶;“比N还N”格式探析[D];湘潭大学;2010年
5 刘金凤;面向自然语言处理的汉语句子语义知识库构建研究[D];鲁东大学;2009年
6 王阿婷;基于概念集合的网页内容过滤方法的研究[D];北京交通大学;2010年
7 石晶;一种高效垃圾短信过滤系统的实现[D];电子科技大学;2010年
8 蔡蕊;一种新的搜索引擎分词词典的研究[D];山东大学;2010年
9 戴霖;网络舆情信息挖掘关键技术研究与应用[D];浙江工商大学;2011年
10 杨玉珍;基于统计与规则的特征权重计算方法研究与应用[D];山东师范大学;2011年
【同被引文献】
中国期刊全文数据库 前10条
1 李迎春,迟呈英,孙冀侠;改进的上下文无关文法及其语法分析[J];鞍山科技大学学报;2003年01期
2 王宇飞;范明钰;王光卫;;一种基于HTTP摘要认证的SIP安全机制[J];重庆邮电学院学报(自然科学版);2005年06期
3 冯志伟;基于短语结构语法的自动句法分析方法[J];当代语言学;2000年02期
4 冯志伟;自然语言处理中的概率语法[J];当代语言学;2005年02期
5 屈玉贵;李奇越;赵保华;刘桂英;;基于ABNF的高速硬件解码方法的研究[J];电子学报;2006年09期
6 李伟;田野;赵保华;周颢;;一种ABNF编码协议消息的通用解析方法[J];计算机工程;2006年13期
7 林颖;史晓东;郭锋;;一种基于概率上下文无关文法的汉语句法分析[J];中文信息学报;2006年02期
8 周强;规则和统计相结合的汉语词类标注方法[J];中文信息学报;1995年03期
9 冯志伟;论歧义结构的潜在性[J];中文信息学报;1995年04期
10 朱胜火,周明,刘昕,黄昌宁;一种有效的概率上下文无关文法分析算法[J];软件学报;1998年08期
中国重要会议论文全文数据库 前1条
1 张浩;刘群;白硕;;结构上下文相关的概率句法分析[A];第一届学生计算语言学研讨会论文集[C];2002年
中国硕士学位论文全文数据库 前6条
1 梁以敏;基于统计的汉语词性标注方法的研究[D];大连理工大学;2004年
2 任宣映;汉韩语言比较及基于规则的汉韩机器翻译系统研究[D];清华大学;2004年
3 王朔;基于Chart算法的句法分析系统的设计与实现[D];湖南大学;2005年
4 祝正运;SIP协议栈的研究与实现[D];浙江大学;2005年
5 段长春;基于SIP的IP视频电话研究与实现[D];大连理工大学;2006年
6 王敏;基于改进的隐马尔科夫模型汉语词性标注[D];山西大学;2007年
【二级引证文献】
中国期刊全文数据库 前2条
1 姜秀玉;杨峰;崔再惠;;SIP协议实现中消息解析的研究[J];计算机工程与设计;2010年13期
2 丁曼;张代远;;一种SIP协议栈中呼叫过程的设计与实现[J];中国新通信;2010年21期
中国硕士学位论文全文数据库 前1条
1 吴云倩;IMS网络中SIP信令解析算法研究[D];吉林大学;2012年
【二级参考文献】
中国期刊全文数据库 前5条
1 周强,黄昌宁;汉语概率型上下文无关语法的自动推导[J];计算机学报;1998年05期
2 冯志伟;中文科技术语的结构描述及潜在歧义[J];中文信息学报;1989年02期
3 孙茂松,黄昌宁;汉语中的兼类词、同形词类组及其处理策略[J];中文信息学报;1989年04期
4 周强,俞士汶;汉语短语标注标记集的确定[J];中文信息学报;1996年04期
5 周强,张伟,俞士汶;汉语树库的构建[J];中文信息学报;1997年04期
【相似文献】
中国期刊全文数据库 前10条
1 李永亮;黄曙光;鲍蕾;;一种基于PageRank算法和知网的词义消歧方法[J];计算机应用与软件;2011年05期
2 周粉;夏幼明;;一种改进的基于知网的语义相似度计算方法[J];云南大学学报(自然科学版);2008年S2期
3 王志;夏士雄;牛强;;本体知识库的自然语言查询重写研究[J];微电子学与计算机;2009年08期
4 孙继明;李舟军;文健;;基于《知网》的汉语词语词义消歧方法[J];计算机与信息技术;2007年03期
5 南铉国;崔荣一;;基于多层次融合的语句相似度计算模型[J];延边大学学报(自然科学版);2007年03期
6 田甜;张振国;;主观题自动阅卷技术研究[J];计算机工程与设计;2010年16期
7 傅继彬;刘杰;贾可亮;毛金涛;;基于知网和术语相关度的本体关系抽取研究[J];现代图书情报技术;2008年09期
8 田卫新;朱福喜;但志平;;一种基于修饰关系的自然语言语义分析方法[J];计算机科学;2010年05期
9 尹中航,王永成,宋聚平,蔡巍;一种基于频次统计的兼类噪声消除方法[J];上海交通大学学报;2003年03期
10 窦竹梅;何新贵;彭甫阳;;人工智能技术在中文全文情报检索中的应用研究[J];情报科学技术;1994年06期
中国重要会议论文全文数据库 前10条
1 王志;夏士雄;牛强;;本体知识库的自然语言查询重写研究[A];2009年全国开放式分布与并行计算机学术会议论文集(上册)[C];2009年
2 朱嫣岚;闵锦;周雅倩;黄萱菁;吴立德;;基于HowNet的词汇语义倾向计算[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
3 郝长伶;董强;;知网知识库描述语言[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
4 毕玉德;张文江;;朝鲜语知识库结构的设计理念及其语言描述[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年
5 刘艳芳;封化民;丁天昌;;中文视频问答系统研究[A];第二届和谐人机环境联合学术会议(HHME2006)——第15届中国多媒体学术会议(NCMT'06)论文集[C];2006年
6 张娜;李济洪;;基于语义标注的中文阅读理解语料库的建设[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
7 邓宾;余正涛;韩露;车文刚;郭剑毅;;基于信息增益改进贝叶斯词义消歧模型[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
8 刘林;刘臻;;基于知识的网上监控系统的研究[A];2007年全国开放式分布与并行计算机学术会议论文集(下册)[C];2007年
9 支流;段慧明;朱学锋;俞士汶;;中文缩略语知识库建设[A];第三届学生计算语言学研讨会论文集[C];2006年
10 白刚;张铮;丁宗尧;朱毅;;中文文本聚类在互联网搜索的研究与应用[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
中国重要报纸全文数据库 前10条
1 ;开天辟地第一回[N];计算机世界;2002年
2 胡红军;软件业应注重搭建行业知识库[N];经济日报;2007年
3 见习记者 廖小珊;中国知网推出优先数字出版 读者可多种数字渠道获取[N];中国新闻出版报;2010年
4 姜恒;“手拉手”中国健康管理知识库与数据中心建设战略合作项目启动[N];中国医药报;2010年
5 沈江;天汇管理系统发挥知识库价值[N];中国计算机报;2001年
6 潘衍习;中国加紧建设《中华文化知识库》[N];人民日报海外版;2007年
7 记者 隋晓梅;农家书屋成为农民的知识库[N];吐鲁番报(汉);2009年
8 一文;“服务为王”:打印机市场制胜的砝码[N];科技日报;2005年
9 李广录;BakBone NetVault TrueCDP可恢复到任意时间点[N];中国计算机报;2008年
10 ;宇通:用知识库搭建OA平台[N];中国计算机报;2004年
中国博士学位论文全文数据库 前10条
1 李良炎;基于词联接的自然语言处理技术及其应用研究[D];重庆大学;2004年
2 卢延鑫;基于自然语言处理技术的循证医学信息提取研究[D];复旦大学;2011年
3 杜永萍;基于模式知识库的问题回答关键技术研究[D];复旦大学;2005年
4 郑逢斌;关于计算机理解自然查询语言的研究[D];西南交通大学;2004年
5 代印唐;基于语义网络的知识协作关键技术研究[D];复旦大学;2009年
6 王立欣;翻译标准自动量化方法研究[D];上海外国语大学;2007年
7 李莎莎;面向搜索引擎的自然语言处理关键技术研究[D];国防科学技术大学;2011年
8 周雅倩;最大熵方法及其在自然语言处理中的应用[D];复旦大学;2005年
9 易勇;计算机辅助诗词创作中的风格辨析及联语应对研究[D];重庆大学;2005年
10 谢学敏;基于动态流通语料库(DCC)的流行语释义信息自动提取研究[D];北京语言大学;2006年
中国硕士学位论文全文数据库 前10条
1 周美希;汉语语句组块及消歧的研究与实现[D];电子科技大学;2005年
2 孙继明;基于知网的汉语词义消歧研究[D];国防科学技术大学;2007年
3 柴晓丽;自动文摘技术的研究与应用[D];长春理工大学;2007年
4 唐琦;基于语义分析的句子相似度计算研究[D];华北电力大学(北京);2009年
5 周舫;汉语句子相似度计算方法及其应用的研究[D];河南大学;2005年
6 李力;利用知网进行(计算机)自然语言处理[D];电子科技大学;2004年
7 刘艳芳;中文视频问答系统[D];燕山大学;2007年
8 张磊;基于知网的汉语隐喻自动处理[D];兰州大学;2007年
9 闫蓉;基于语义的汉语词义消歧方法研究[D];西北大学;2006年
10 苗雪雷;基于条件随机场的汉语词义消歧方法研究[D];沈阳航空工业学院;2007年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026