收藏本站
《华中科技大学》 2007年
收藏 | 手机打开
二维码
手机客户端打开本文

中文自动问答系统研究

蔡刚山  
【摘要】: 随着互联网的快速发展,为人们提供了丰富的信息资源。利用搜索引擎可以帮助人们搜索自己想要的信息,但是目前的搜索引擎存在一些缺点,并不能满足人们方便、快速、准确地获取信息的需要。自动问答系统正是为了满足人们的这种愿望而发展起来的,它通过采用自然语言处理技术,用简洁准确的语言回答用户用自然语言提出的问题。 自动问答系统的研究受到国内外很多科研机构的重视,已经开发出相对成熟的英文自动问答系统,但是参与中文自动问答系统研究的科研机构还不是很多,而且还没有出现成熟的中文自动问答系统。本文对中文自动问答系统的研究进行了一些探索,希望能够促进中文自动问答技术的发展。 本文中提出的中文自动问答系统主要包括三个组成部分:问题理解、信息检索和答案抽取。首先利用问题理解对用户提交的问题进行处理,掌握用户的提问意图。问题理解包括:词法分析、问题分类、句法分析、关键词提取和扩展。信息检索则是利用问题理解中产生的检索关键词,首先从本地知识库检索相关的答案,或进一步利用多个搜索引擎从网络上获取相关的网页文档交给答案抽取模块进行处理。利用网络资源构建大规模的本地知识库。答案抽取模块对搜索引擎检索获取的网页文档进行处理,通过句子过滤、实体识别、句法分析等处理方法从文档中抽取出相关的句子或短语作为问题的答案返回给用户。 本文还对实现的中文自动问答系统进行了测试,对测试结果进行了分析。最后对论文工作进行了总结,指出了本文中实现的问答系统还需要改进的地方,为中文自动问答系统的进一步研究提供了参考。
【关键词】:问答系统 本地知识库 搜索引擎 句法分析
【学位授予单位】:华中科技大学
【学位级别】:硕士
【学位授予年份】:2007
【分类号】:TP319
【目录】:
  • 摘要4-5
  • ABSTRACT5-8
  • 1 绪论8-15
  • 1.1 自动问答系统的研究意义8-9
  • 1.2 自动问答系统在国内外的研究现状9-10
  • 1.3 自动问答系统的关键问题10-12
  • 1.4 自动问答系统的评测方法12
  • 1.5 本文主要的研究内容12-13
  • 1.6 本文实现的系统结构13-15
  • 2 问题理解15-24
  • 2.1 词法分析15-17
  • 2.2 问题分类17-21
  • 2.3 句法分析21-22
  • 2.4 关键词提取22-23
  • 2.5 关键词扩展23
  • 2.6 本章小结23-24
  • 3 信息检索24-42
  • 3.1 本地知识库检索24-38
  • 3.2 搜索引擎检索38-41
  • 3.3 本章小结41-42
  • 4 答案抽取42-50
  • 4.1 句子过滤42-43
  • 4.2 实体识别43-47
  • 4.3 句法分析47-49
  • 4.4 答案排序49
  • 4.5 本章小结49-50
  • 5 问答系统评测50-61
  • 5.1 问答系统评测平台50-53
  • 5.2 系统测试数据准备53-55
  • 5.3 系统测试评测指标55-57
  • 5.4 系统测试结果与分析57-60
  • 5.5 本章小结60-61
  • 6 总结与展望61-63
  • 致谢63-64
  • 参考文献64-67
  • 附录1 攻读学位期间发表论文目录67

【引证文献】
中国期刊全文数据库 前4条
1 董云耀;陈小翠;黄炜;;基于RST和SVM的中文问题分类方法[J];杭州电子科技大学学报;2010年06期
2 郑诚;李清;刘福君;;改进的VSM算法及其在FAQ中的应用[J];计算机工程;2012年17期
3 梁维薇;吕立辉;冉蜀阳;;基于特定领域的自动问题-答案对的形成[J];现代计算机(专业版);2012年36期
4 宋欣;申安来;郭凤媛;钟杰;胡艳君;王建林;;基于CIM的相似度综合评价算法[J];现代情报;2013年03期
【参考文献】
中国期刊全文数据库 前6条
1 秦兵;刘挺;王洋;郑实福;李生;;基于常问问题集的中文问答系统研究[J];哈尔滨工业大学学报;2003年10期
2 李素建;基于语义计算的语句相关度研究[J];计算机工程与应用;2002年07期
3 向晓雯,史晓东,曾华琳;一个统计与规则相结合的中文命名实体识别系统[J];计算机应用;2005年10期
4 崔桓,蔡东风,苗雪雷;基于网络的中文问答系统及信息抽取算法研究[J];中文信息学报;2004年03期
5 周明,黄昌宁;面向语料库标注的汉语依存体系的探讨[J];中文信息学报;1994年03期
6 俞鸿魁;张华平;刘群;吕学强;施水才;;基于层叠隐马尔可夫模型的中文命名实体识别[J];通信学报;2006年02期
【共引文献】
中国期刊全文数据库 前10条
1 吴娜炯;;格语法在主观题自动阅卷中的应用[J];办公自动化;2010年08期
2 付艳;杨冬青;唐世渭;伍伟;王腾蛟;高军;;基于实体识别的在线主题检测方法[J];北京大学学报(自然科学版);2009年02期
3 刘文华;康海燕;;领域问答系统生成器的研究[J];北京信息科技大学学报(自然科学版);2009年03期
4 骆正华,樊孝忠,刘林,龚永罡;基于E-Chunk的问句实例分析系统[J];北京理工大学学报;2005年01期
5 许云,樊孝忠,张锋;基于知网的语义相关度计算[J];北京理工大学学报;2005年05期
6 陈康;樊孝忠;刘杰;贾可亮;;基于问句语义表征的中文问句相似度计算方法[J];北京理工大学学报;2007年12期
7 王常亮;闫利华;吴曦德;;基于XML的智能答疑系统研究[J];赤峰学院学报(自然科学版);2008年09期
8 靳伟;张月清;王芳;;基于本体的分类检索系统的设计与实现[J];河北农业大学学报;2010年02期
9 王跃龙;姬东鸿;;汉语树库综述[J];当代语言学;2009年01期
10 金博,史彦军,滕弘飞;基于语义理解的文本相似度算法[J];大连理工大学学报;2005年02期
【同被引文献】
中国期刊全文数据库 前10条
1 樊孝忠,李宏乔,李良富,叶江;银行领域汉语自动问答系统BAQS的研究与实现[J];北京理工大学学报;2004年06期
2 陈伟,丁秋林;数据清理中编辑距离的应用及Java编程实现[J];电脑与信息技术;2003年06期
3 龙树全;赵正文;唐华;;中文分词算法概述[J];电脑知识与技术;2009年10期
4 秦兵;刘挺;王洋;郑实福;李生;;基于常问问题集的中文问答系统研究[J];哈尔滨工业大学学报;2003年10期
5 王继成,潘金贵,张福炎;Web文本挖掘技术研究[J];计算机研究与发展;2000年05期
6 王树西;问答系统:核心技术、发展趋势[J];计算机工程与应用;2005年18期
7 张亮;陈肇雄;黄河燕;;问题分类的计算模型研究[J];计算机科学;2006年04期
8 吴晨;张全;;HNC问答处理系统关键算法研究[J];计算机科学;2006年06期
9 刘朝涛;李祖枢;;基于疑问句句型识别的问题理解研究[J];计算机科学;2008年12期
10 余正涛;樊孝忠;宋丽哲;高盛祥;;汉语问答系统答案提取方法研究[J];计算机工程;2006年03期
【二级引证文献】
中国期刊全文数据库 前1条
1 吴惠敏;叶少珍;;基于粗糙集与SVM骨性关节炎复方中药功效分析研究[J];福州大学学报(自然科学版);2013年03期
【二级参考文献】
中国期刊全文数据库 前10条
1 冯志伟;;特思尼耶尔的从属关系语法[J];国外语言学;1983年01期
2 张仰森,徐波,曹元大;自然语言处理中的语言模型及其比较研究[J];广西师范大学学报(自然科学版);2003年01期
3 刘群,张华平,俞鸿魁,程学旗;基于层叠隐马模型的汉语词法分析[J];计算机研究与发展;2004年08期
4 周明,黄昌宁,张敏,白栓虎,吴升;统计与规则并举的汉语句法分析模型[J];计算机研究与发展;1994年02期
5 张华平,刘群;基于角色标注的中国人名自动识别研究[J];计算机学报;2004年01期
6 庄明,老松杨,吴玲达;一种统计和词性相结合的命名实体发现方法[J];计算机应用;2004年01期
7 吕雅娟,赵铁军,杨沐昀,于浩,李生;基于分解与动态规划策略的汉语未登录词识别[J];中文信息学报;2001年01期
8 王宁,葛瑞芳,苑春法,黄锦辉,李文捷;中文金融新闻中公司名的识别[J];中文信息学报;2002年02期
9 郑实福,刘挺,秦兵,李生;自动问答综述[J];中文信息学报;2002年06期
10 黄昌宁;关于处理大规模真实文本的谈话[J];语言文字应用;1993年02期
【相似文献】
中国期刊全文数据库 前10条
1 陈玉;;基于“为什么”问句的中文问答系统研究[J];农业网络信息;2010年11期
2 陈玉;;基于关键词距离的中文问答系统研究[J];电脑开发与应用;2011年01期
3 付鸿鹄;基于W eb的开放领域问答系统研究[J];现代图书情报技术;2005年09期
4 张莉;李东生;肖燕峰;;基于Web的受限领域问答系统研究及应用[J];电脑开发与应用;2007年05期
5 张莉;刘雅举;李东明;侯晨伟;;中文问句分类系统的分析[J];科技情报开发与经济;2007年25期
6 杜玮;邸书灵;孙树静;;基于互联网技术的问答系统研究[J];微计算机信息;2007年36期
7 谢能付;;基于交互式接口的农产品问答系统[J];农业网络信息;2008年08期
8 陈敏杰;;问答系统中问题分析模块的实现[J];经营管理者;2009年13期
9 康海燕;李飞娟;苏文杰;;基于问句表征的web智能问答系统[J];北京信息科技大学学报(自然科学版);2011年01期
10 李秋青;;基于问答(Q&A)系统原理的WAP信息检索[J];科技广场;2006年01期
中国重要会议论文全文数据库 前10条
1 彭轲;廖闻剑;;浅析搜索引擎[A];中国通信学会第五届学术年会论文集[C];2008年
2 李丹;;如何利用搜索引擎查找中医药信息[A];中国中医药信息研究会第二届理事大会暨学术交流会议论文汇编[C];2003年
3 邓长寿;郭景峰;杨焱林;邓安远;;下一代Web搜索引擎初探[A];第十八届全国数据库学术会议论文集(研究报告篇)[C];2001年
4 维尼拉·木沙江;吐尔洪·吾司曼;;维、哈、柯文搜索引擎中网页爬行器的设计与实现[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年
5 汤薇;曾艳;;构建校园网搜索引擎必要性分析[A];广西计算机学会2008年年会论文集[C];2008年
6 姚树宇;赵少东;;一种使用分布式技术的搜索引擎[A];2005年全国开放式分布与并行计算学术会议论文集[C];2005年
7 倪俊峰;;基于黄页搜索引擎的关键字排名广告系统的设计与实现[A];2005年中国索引学会年会暨学术研讨会论文集[C];2005年
8 何靖;陈翀;闫宏飞;;开放域问答系统研究综述[A];第六届全国信息检索学术会议论文集[C];2010年
9 栗振江;杨洋;李丽;;智能问答系统[A];2011年全国通信安全学术会议论文集[C];2011年
10 张怡;查贵庭;;SEO在信息服务中的应用研究[A];2010年中国索引学会年会暨学术研讨会论文集[C];2010年
中国重要报纸全文数据库 前10条
1 陈沛 刘学习编译;门户与搜索日渐融合[N];计算机世界;2006年
2 李一鑫;搜索排名的红与黑[N];财经时报;2007年
3 周文林;搜狗3.0能否撼动搜索市场[N];经济参考报;2007年
4 惠正一;比尔·盖茨:微软不怕Google[N];第一财经日报;2005年
5 赛迪顾问股份有限公司互联网与电子商务咨询中心 常燕杰;搜索,还是门户[N];中国计算机报;2005年
6 陈珊;浙江移动推出手机搜索引擎服务[N];人民邮电;2005年
7 赵法忠;搜索引擎还需悠着点[N];中国经营报;2005年
8 金朝力;搜索引擎火拼搜索质量[N];北京商报;2006年
9 本报记者  赵晓辉 孟昭丽;搜索引擎驶入“避风港”[N];中国证券报;2006年
10 孙琎;搜索引擎惊喜侵权官司止于“避风港”?[N];第一财经日报;2006年
中国博士学位论文全文数据库 前10条
1 倪兴良;问答系统中的短文本聚类研究与应用[D];中国科学技术大学;2011年
2 路遥;用户交互式问答系统中问题推荐机制的研究[D];中国科学技术大学;2012年
3 黎新;面向问答系统的段落检索技术研究[D];中国科学技术大学;2010年
4 张巍;融合FAQ、本体和推理技术的问答系统研究[D];太原理工大学;2011年
5 岑荣伟;基于用户行为分析的搜索引擎评价研究[D];清华大学;2010年
6 李群;主题搜索引擎聚类算法的研究[D];北京林业大学;2011年
7 胡德鹏;基于农业本体问句分析的问答系统研究与架构设计[D];中国农业科学院;2013年
8 苏君华;面向搜索引擎的技术接受模型研究[D];南京大学;2011年
9 刘佐达;分布协作式搜索引擎模型及算法研究[D];清华大学;2011年
10 陈旭毅;基于索引云的企业搜索引擎实现研究[D];武汉大学;2011年
中国硕士学位论文全文数据库 前10条
1 蔡刚山;中文自动问答系统研究[D];华中科技大学;2007年
2 卜文娟;基于概念图的中文问答系统的研究与实现[D];西北大学;2010年
3 刘祥;基于课程知识的问答系统研究与应用[D];大连海事大学;2010年
4 李雷;基于Nutch的农业信息搜索引擎实现和优化[D];吉林大学;2011年
5 胡家豪;基于互联网的WEB舆情问答系统[D];电子科技大学;2011年
6 孙林;基于在线论坛的问答对识别研究与问答系统实现[D];哈尔滨工业大学;2010年
7 李旭锋;中文问答系统中问句理解和相似度计算的研究与实现[D];华南理工大学;2010年
8 刘渊杰;社区问答系统最佳回答机制的研究[D];上海交通大学;2010年
9 李畅;智能问答系统在高中物理教学中的应用[D];陕西师范大学;2011年
10 薛云;Internet上元搜索引擎的研究与设计[D];太原理工大学;2003年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026