收藏本站
《重庆大学》 2010年
收藏 | 手机打开
二维码
手机客户端打开本文

中文问答系统中的句型理论及其应用研究

刘朝涛  
【摘要】:自动问答系统(QA),是一种用自然语言提问,并由系统自主获取知识并向用户直接返回所需答案的一种新的信息检索系统。问答系统一般包括三个主要组成部分:问题理解、信息检索和答案抽取。 目前QA已成为非常热门的研究方向,其中以英文的QA系统居多,中文问答系统这几年也受到国内外一些机构的重视。中文QA系统的研究与英文等语种的QA系统相比,由于中文自身的特点,使得中文QA系统在研究中有不少自身的特点,有时完全不同于英文等语种的QA系统,这也是中文QA系统研究的一个关键。 自然语言处理技术是问答系统的关键技术,要提高问答系统的水平,需要从与QA系统有关的自然语言处理技术着手,特别是如何准确把握问题和答案的语义。但目前,自然语言的语义分析技术还处于非常初级的阶段,因此,多数的问答系统都是回避语义分析或者只是基于浅层的语义分析去进行研究,因此难以取得好的效果。如何在问答系统中提高语义分析水平应该是提高问答系统水平的重要问题。 句子的语义主要包括两个部分:构成句子的成份的词义和由句子结构确定的结构语义。句型的研究是语言学中句法结构层面研究中一个很重要的内容。一种语言的句子是无限的,而句型是有限的,通过研究有限的句型来把握无限的句子是句型研究的主要目标。属于同种句型的句子通常在句法结构、语义解释等方面具有一定的一致性。因此,通过研究句型及每种句型的结构语义,可以把整个语言中的句子根据句型分成若干个类型。对多数类型的句子而言,句子的结构语义是由句型决定的,通过建立每种句型的句子的结构语义计算规则,再标注出组成句子的词语的词义就能把握这些句子的语义。可见,通过句型来实现对句子的语义分析,应该是对多数句子进行语义分析的一条可行的研究方法。对于自动问答系统而言,疑问句的句型同疑问语义之间的关系更为密切,通过分析提出问题的疑问句的句型,可以准确地把握问句的疑问语义,进而实现对问句的理解;而预先根据问题类型规划出问题答案的句型,则能够更方便准确地搜索和抽取出问题的答案,并实现问题的回答。 本文在句型系统研究的基础上研究了一个基于开放域的中文自动问答系统——虚拟信息顾问系统(VIC),它要求用自然语言提出问题,系统根据问题自动在网络上或文档集合中搜集相关资料,找出答案后回答用户的提问。主要工作包括: 一、提出了句型系统的形式化理论和句型的语义计算方法。句型系统的形式化理论包括句型的形式化定义、句型描述、句型语义计算等内容。句型的形式化定义在前人对句型系统的研究和以及对句法结构研究的基础上,以句法同构为句型的分类标准,用生成语法的方式形式化地定义了句型概念。句型的描述则包括由形式化定义直接得到的推导描述、与自然语言学界中句型/句式描述类似的字符串描述、以及向量描述。句型语义计算的方法以句型向量中的成分为变量,根据句型的结构语义写出句型向量中的成分的格角色,在句子语义计算时,根据句子所属句型及句型语义就能标注出句子成分在句子中的格角色。 二、提出了一种基于向量空间模型(VSM)的句型识别方法。基于向量空间模型(VSM)的句型识别方法通过计算句子与句型的相似度来排序并实现对句子句型的识别,即通过计算汉语句子中的特征词、短语和词的词性、以及句子中的语序关系,来实现对汉语句子句型的识别。该方法先以句型向量为模板对句子结构进行规约,得到基于句型模式的句型结构,然后将得到的句型结构表示成向量形式,并与句型向量进行相似度计算,并将一个句型层次的所有句型模式与句子的相似度进行排序,从而实现对句子的句型的识别。文章以疑问句的句型识别方法为例对句型识别进行了测试,测试结果标明,在句法分析正确的情况下该句型识别方法的正确率很高,即使对句法分析错误的句子,也能正确识别其中一部分句子的句型,说明这种识别技术具有较好的识别效果和较好的稳定性能。 三、提出了基于句型系统的问题理解方法及基于问题句型系统的中文问答系统架构。句型是句子的句法结构分类,而问题分类是对问题的疑问语义分类,对于疑问句而言,句型与疑问语义紧密相关,通过句型联系问题的语义分类进而实现对问题的分类是本文问题理解的主要方法。文章通过对疑问句短语分类、建立问题分类标准和分类规则,并进而通过句型实现对疑问句的语义计算,再根据疑问语义得到问题的标准形,最后利用疑问句的句型识别技术实现了问题的分类和理解。汉语中疑问词的非疑问现象是一种常见的语法现象,通过对汉语中疑问词的非疑问用法的研究和非疑问用法的句型识别,达到了提高对问题分类和理解的水平的目的。 四、针对自动问答系统中信息检索的特点和要求,提出了结合自然文档的结构,以文档段序、句序和词序为基础的改进向量空间模型(VSM)检索算法。并设计出适宜于VIC的信息检索模块。 五、实现了VIC中问题理解子系统、信息检索子系统,并基于句型系统对问答系统的答案抽取策略和方法进行了初步研究。
【学位授予单位】:重庆大学
【学位级别】:博士
【学位授予年份】:2010
【分类号】:TP391.1

【引证文献】
中国硕士学位论文全文数据库 前2条
1 陈阳;自然语言理解中疑问代词研究及其在产品设计中的应用[D];西安电子科技大学;2011年
2 耿端;基于同义词词林的评分在中医案例自测系统中的应用[D];西北大学;2013年
【参考文献】
中国期刊全文数据库 前10条
1 冯志伟;;自然语言处理中理性主义和经验主义的利弊得失[J];长江学术;2007年02期
2 李广原,陈丹;文本信息检索技术[J];广西科学院学报;2001年02期
3 秦兵;刘挺;王洋;郑实福;李生;;基于常问问题集的中文问答系统研究[J];哈尔滨工业大学学报;2003年10期
4 余正涛,樊孝忠,郭剑毅;基于支持向量机的汉语问句分类[J];华南理工大学学报(自然科学版);2005年09期
5 陆干;郑淑明;;现代汉语句型体系建构设想[J];哈尔滨工业大学学报(社会科学版);2007年03期
6 刘群,张华平,俞鸿魁,程学旗;基于层叠隐马模型的汉语词法分析[J];计算机研究与发展;2004年08期
7 李保利,陈玉忠,俞士汶;信息抽取研究综述[J];计算机工程与应用;2003年10期
8 王萌,何婷婷,张伟;基于概念向量空间模型的中文自动文摘系统[J];计算机工程与应用;2005年01期
9 张晓艳;王挺;陈火旺;;命名实体识别研究[J];计算机科学;2005年04期
10 曹志娟;李祖枢;刘朝涛;;自动问答系统中的问题理解研究[J];计算机科学;2005年11期
中国重要会议论文全文数据库 前1条
1 张浩;刘群;白硕;;结构上下文相关的概率句法分析[A];第一届学生计算语言学研讨会论文集[C];2002年
中国博士学位论文全文数据库 前2条
1 张尹琼;疑问代词的非疑问用法[D];复旦大学;2005年
2 玛琳娜·吉布拉泽;现代汉语疑问代词的多视角研究[D];南京师范大学;2005年
中国硕士学位论文全文数据库 前5条
1 来德强;“哪儿”的非疑问用法[D];河南大学;2001年
2 李俊香;汉语的“怎么”在英语中的对应形式[D];延边大学;2003年
3 曹志娟;自动问答系统中的问题理解与信息检索研究[D];重庆大学;2005年
4 廖先桃;中文命名实体识别方法研究[D];哈尔滨工业大学;2006年
5 李伟;现代汉语句型自动识别的研究[D];厦门大学;2007年
【共引文献】
中国期刊全文数据库 前10条
1 张国华;;徐杰《生成语法的“语类”与传统语法的“词类”比较研究》述评[J];阿坝师范高等专科学校学报;2009年02期
2 张世海,刘晓燕,欧进萍;高层结构智能选型知识发现及方法比较[J];四川建筑科学研究;2005年05期
3 丁俊苗;;不足与需要:论标点符号的语法功能[J];安徽大学学报(哲学社会科学版);2008年04期
4 范振强;肖治野;;双重否定:否定之否定[J];安徽大学学报(哲学社会科学版);2010年02期
5 司罗红;;疑问特征及一般疑问句的生成机制[J];安徽大学学报(哲学社会科学版);2012年01期
6 黄婉梅;表处所的“在Np”的语义分析[J];安徽教育学院学报;2002年04期
7 潘洁珠;半结构化数据及其数据模型[J];安徽教育学院学报;2003年06期
8 胡德明;;反问特有的句法结构[J];合肥师范学院学报;2010年01期
9 孙宜春;;“NP+V-起来+AP(VP)”句式的语义结构[J];合肥师范学院学报;2010年01期
10 樊友新;;从“被就业”看“被”的语用功能[J];合肥师范学院学报;2010年02期
中国重要会议论文全文数据库 前10条
1 章曙光;;基于CBR的电力负荷预测系统的研究与实现[A];2005年“数字安徽”博士科技论坛论文集[C];2005年
2 赵兴;余正涛;邹俊杰;郭剑毅;毛存礼;;结合依存句法与实体的领域答案句模学习方法[A];中国自动化学会控制理论专业委员会A卷[C];2011年
3 查星云;;一种钢铁企业金属损耗平衡分析方法[A];全国冶金自动化信息网2012年年会论文集[C];2012年
4 于江德;王希杰;樊孝忠;;汉语词法分析中上文和下文孰重孰轻[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
5 赛依旦·阿不力米提;吐尔根·依布拉音;;基于规则与统计的维吾尔族人名识别研究[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
6 王雅莉;古丽拉·阿东别克;;哈萨克语通用词汇自动提取方法研究与实现[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
7 通拉嘎;赵小兵;;论蒙古语词素切分的实现[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
8 邢富坤;宋柔;;自动词性标注中语法因素和词汇因素对英汉语的不同影响[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
9 万菁;姬东鸿;任函;冯文贺;;汉语复合名词短语特征结构的标注研究[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
10 王荀;李素建;宋涛;姜伯平;;服务于内容侧面发现的框架识别[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
中国博士学位论文全文数据库 前10条
1 王杰;基于人工智能的乒乓球比赛技战术诊断与评估研究[D];上海体育学院;2010年
2 陈佳;论英汉运动事件表达中“路径”单位的“空间界态”概念语义及其句法—语义接口功能[D];上海外国语大学;2010年
3 唐树华;有些隐喻为什么不可能[D];上海外国语大学;2010年
4 杨石乔;基于语料库的汉语医患会话修正研究[D];上海外国语大学;2010年
5 吴善子;汉韩反诘语气副词对比研究[D];上海外国语大学;2010年
6 李红梅;韩国语范围表达研究[D];上海外国语大学;2010年
7 牟向伟;模糊语义个性化推荐系统在电子政务中的应用研究[D];大连海事大学;2010年
8 全惠敏;电能质量相关信号的S变换检测算法及应用研究[D];湖南大学;2010年
9 刘春兰;《训世评话》语法研究[D];南开大学;2010年
10 王用源;汉语和藏语复音词构词比较研究[D];南开大学;2010年
中国硕士学位论文全文数据库 前10条
1 李金华;基于SVM的多类文本分类研究[D];山东科技大学;2010年
2 孙岭;一种基于前缀表达式的Web信息抽取方法的关键问题的实现[D];山东科技大学;2010年
3 吴香庭;基于遗传算法的K-means聚类方法的研究[D];山东科技大学;2010年
4 白冰;基于数据处理中心的企业竞争情报系统研究[D];山东科技大学;2010年
5 王廷刚;Petri网表征语言和可达性分析[D];山东科技大学;2010年
6 宋文平;现代汉语“A而不B”格式的多角度研究[D];哈尔滨师范大学;2010年
7 赵桂阳;现代汉语“不是X的X”结构考察[D];哈尔滨师范大学;2010年
8 刘敏;“难不成”的衍生过程[D];哈尔滨师范大学;2010年
9 马晶晶;表人名词类词缀“X手”、“X者”、“X员”分析比较[D];辽宁师范大学;2010年
10 顾倩;现代汉语否定副词“不”“没(没有)”“别”的对比研究[D];辽宁师范大学;2010年
【同被引文献】
中国期刊全文数据库 前10条
1 倪兰;现代汉语疑问代词的基本语义分析[J];北方论丛;2005年04期
2 邓志鸿,唐世渭,张铭,杨冬青,陈捷;Ontology研究综述[J];北京大学学报(自然科学版);2002年05期
3 李久熙;王春山;赵树朋;高喜银;叶振合;;产品设计专家系统研究[J];包装工程;2005年06期
4 田久乐;赵蔚;;基于同义词词林的词语相似度计算方法[J];吉林大学学报(信息科学版);2010年06期
5 胡裕树;汉语语法研究的回顾与展望[J];复旦学报(社会科学版);1994年05期
6 郭艳华,周昌乐;自然语言理解研究综述[J];杭州电子工业学院学报;2000年01期
7 沈兰荪;仪器仪表智能化的进展[J];测控技术;1999年01期
8 林鸿飞,战学刚,姚天顺;基于概念的文本结构分析方法[J];计算机研究与发展;2000年03期
9 魏丽君;疑问代词的非疑问用法[J];佳木斯师专学报;1995年03期
10 孟遥;李生;赵铁军;杨沐昀;;基于统计的句法分析技术综述[J];计算机科学;2003年09期
中国博士学位论文全文数据库 前5条
1 郭鸿志;多源语义知识库融合方法研究[D];哈尔滨工业大学;2011年
2 张尹琼;疑问代词的非疑问用法[D];复旦大学;2005年
3 玛琳娜·吉布拉泽;现代汉语疑问代词的多视角研究[D];南京师范大学;2005年
4 张显;信息距离理论及其在问答系统中的应用研究[D];清华大学;2008年
5 宋玲;语义相似度计算及其应用研究[D];山东大学;2009年
中国硕士学位论文全文数据库 前10条
1 石安磊;基于文本相似度评分的中医案例分析系统研究与实现[D];西北大学;2011年
2 吴全娥;汉语句子相似度计算及其在自动问答系统中的应用[D];西南大学;2011年
3 李剑;基于分块的句子语义相似度研究[D];安徽工业大学;2011年
4 何爱元;基于词典和概率统计的中文分词算法研究[D];辽宁大学;2011年
5 张振幸;基于知网的模块化的中文句子相似度计算研究[D];安徽工业大学;2010年
6 郭扉扉;主观题自动评分技术研究[D];华中科技大学;2011年
7 丁康健;考试系统中智能化辅助阅卷技术研究[D];哈尔滨工程大学;2011年
8 马军红;文本相似度计算理论与应用研究[D];西北大学;2011年
9 张添一;基于文本相似度计算的主观题自动阅卷技术研究[D];东北师范大学;2011年
10 耿春霞;基于机械设计领域的汉语句法分析研究[D];西安电子科技大学;2004年
【二级参考文献】
中国期刊全文数据库 前10条
1 熊仲儒;“呢”在疑问句中的意义[J];安徽师范大学学报(人文社会科学版);1999年01期
2 邱莉芹,邓根芹,顾元华;浅谈“哪里”的否定用法[J];常熟高专学报;2000年05期
3 李书同;由“什么”一词的否定作用引发的思考[J];郴州师范高等专科学校学报;2002年03期
4 吕学强,任飞亮,黄志丹,姚天顺;句子相似模型和最相似句子查找算法[J];东北大学学报;2003年06期
5 赵国宏,朱新梅;论网络高等教育的现状及其发展趋势[J];中国远程教育;2002年05期
6 LaurenceR.Horn;沈家煊;;语用学理论(上)[J];国外语言学;1991年02期
7 何刚;疑问句的语言学解释——主要理论观点和方法[J];国外语言学;1997年02期
8 詹卫东;80年代以来汉语信息处理研究述评──作为现代汉语语法研究的应用背景之一[J];当代语言学;2000年02期
9 孙宏林,俞士汶;浅层句法分析方法概述[J];当代语言学;2000年02期
10 冯志伟;基于短语结构语法的自动句法分析方法[J];当代语言学;2000年02期
中国重要会议论文全文数据库 前2条
1 高山;张艳;徐波;宗成庆;韩兆兵;;基于三元统计模型的汉语分词及标注一体化研究[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
2 吴友政;赵军;段湘煜;徐波;;构建汉语问答系统评测平台[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
中国博士学位论文全文数据库 前1条
1 由丽萍;构建现代汉语框架语义知识库技术研究[D];上海师范大学;2006年
中国硕士学位论文全文数据库 前3条
1 赵辄谦;基于互联网的中文问答系统研究[D];山西大学;2003年
2 刘红星;分布式系统中的文本信息检索技术研究[D];清华大学;2004年
3 杭月芹;基于文档查询信息的检索系统研究与实现[D];扬州大学;2005年
【相似文献】
中国期刊全文数据库 前10条
1 李杜;陈松乔;;基于语义的动态服务组织模型[J];计算机技术与发展;2008年11期
2 韩继红;范钰丹;王亚弟;郭渊博;;一种基于语义的安全协议形式化模型[J];计算机科学;2009年02期
3 高明;王继成;李江峰;;基于语义支持的Deep Web数据抽取[J];计算机科学;2010年03期
4 徐迎晖;杨榆;钮心忻;杨义先;;基于语义的文本隐藏方法[J];计算机系统应用;2006年06期
5 曹丹;薛明;许元春;;XML在WEB挖掘中的应用[J];新乡师范高等专科学校学报;2006年02期
6 朱俊武;王建东;姜艺;孙川;;基于形式语义的Web服务交互模型[J];吉林大学学报(信息科学版);2006年04期
7 朱俊武;王建东;李斌;;面向语义Web服务的本体及融合机制[J];南京理工大学学报(自然科学版);2006年06期
8 任红博;邢春晓;;一种基于领域本体的启发式web服务组合方法(英文)[J];Journal of Southeast University(English Edition);2007年03期
9 杜玮;邸书灵;孙树静;;基于互联网技术的问答系统研究[J];微计算机信息;2007年36期
10 李晓辉;王盼卿;齐剑锋;贺天章;;基于本体的异构信息查询技术研究[J];军械工程学院学报;2007年06期
中国重要会议论文全文数据库 前10条
1 汪云凤;李心科;;云服务环境下的服务聚合方法研究[A];2011中国仪器仪表与测控技术大会论文集[C];2011年
2 于冰;于守健;丁祥武;乐嘉锦;;基于多层次接口匹配的语义Web服务自动组合研究[A];第二十二届中国数据库学术会议论文集(技术报告篇)[C];2005年
3 洪忻;;网上语言翻译的质量改进策略[A];机器翻译研究进展——2002年全国机器翻译研讨会论文集[C];2002年
4 李霖;王红;朱海红;李德仁;;基于形式本体的地理概念语义分析方法[A];中国地理学会2007年学术年会论文摘要集[C];2007年
5 章真;曹云娟;;模糊集论形式公理化初探[A];1996中国控制与决策学术年会论文集[C];1996年
6 陈玉;;搭配研究及其实际意义[A];福建省外国语文学会2002年会论文集[C];2002年
7 聂文龙;;法律逻辑中的内涵逻辑方法[A];第十四届全国法律逻辑学术讨论会论文集[C];2006年
8 张华;;浅析“再见”和“拜拜”[A];语言学论文选集[C];2001年
9 陈铁凤;;俄语口语截短复合词研究[A];中国首届“海峡两岸俄语教学与研究学术讨论会”论文集[C];2005年
10 贾雪琴;;基于语义的医疗卫生信息集成[A];中国通信学会信息通信网络技术委员会2009年年会论文集(下册)[C];2009年
中国重要报纸全文数据库 前10条
1 乐天编译;语义Web何时展翅高飞?[N];计算机世界;2007年
2 周凤章;药品包装图形语义浅析[N];中国包装报;2001年
3 乐天 编译;语义Web:电脑能懂的网络[N];计算机世界;2011年
4 沈敬怡;谁叩响了Web3.0之门[N];中国高新技术产业导报;2008年
5 兰瑞平;提高语文解题能力从语义语境语感入手[N];北京日报;2006年
6 本报记者 谌力;标准太多[N];网络世界;2007年
7 张柠;英雄的人格和语义[N];南方周末;2007年
8 余岱宗;于细微处呈现精彩[N];文艺报;2006年
9 北京大学计算机科学技术系 蒋严冰 邵维忠;UML 2001:标准化的《奥德赛》史诗[N];计算机世界;2001年
10 刘 莎;语义约定全文翻译: 机器翻译的“日心说”?[N];计算机世界;2002年
中国博士学位论文全文数据库 前10条
1 刘朝涛;中文问答系统中的句型理论及其应用研究[D];重庆大学;2010年
2 王葆华;动词的语义及论元配置[D];复旦大学;2003年
3 赵玉茗;文本间语义相关性计算及其应用研究[D];哈尔滨工业大学;2009年
4 陈华钧;Web语义查询与推理研究[D];浙江大学;2004年
5 胡德鹏;基于农业本体问句分析的问答系统研究与架构设计[D];中国农业科学院;2013年
6 倪兴良;问答系统中的短文本聚类研究与应用[D];中国科学技术大学;2011年
7 路遥;用户交互式问答系统中问题推荐机制的研究[D];中国科学技术大学;2012年
8 刘佐艳;语义的模糊性与民族文化[D];黑龙江大学;2003年
9 雒自清;语义块类型、构成及变换的分析与处理[D];中国科学院研究生院(声学研究所);2004年
10 黎新;面向问答系统的段落检索技术研究[D];中国科学技术大学;2010年
中国硕士学位论文全文数据库 前10条
1 张诚;基于领域知识的限定域中文问答系统研究[D];上海交通大学;2010年
2 卜文娟;基于概念图的中文问答系统的研究与实现[D];西北大学;2010年
3 刘祥;基于课程知识的问答系统研究与应用[D];大连海事大学;2010年
4 李旭锋;中文问答系统中问句理解和相似度计算的研究与实现[D];华南理工大学;2010年
5 刘立成;汉语唯一性范围副词的研究与应用[D];吉林大学;2005年
6 刘琍;“程度副词+名词”的语义、语用和句法分析[D];四川师范大学;2005年
7 石立桩;基于语义的图像检索方法的研究[D];华北电力大学(河北);2006年
8 农朗诗;程度补语“极”、“透”、“死”、“坏”个体研究[D];广西师范大学;2007年
9 李静;从语义和语用的视角看文学翻译的科学途径[D];江苏科技大学;2010年
10 赵亚丽;《论衡》助动词系统初论[D];吉林大学;2005年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026