收藏本站
《哈尔滨工业大学》 2006年
收藏 | 手机打开
二维码
手机客户端打开本文

中文问答系统中问题分类及答案候选句抽取的研究

文勖  
【摘要】: 自动问答系统是集自然语言处理技术和信息检索技术于一身的新一代智能搜索引擎。问答系统包括问题分类、查询扩展、文本检索、答案抽取和答案选择排序,其中,问题分类和答案抽取最为关键。本论文主要利用自然语言处理技术,研究中文问答系统的两个关键技术:问题分类和候选答案句抽取。 在问答系统中,问题分类作为其第一个重要模块主要有两个作用,第一,问题分类能有效地减少候选答案的空间,提高系统返回答案的准确率。第二,问题分类提供的答案类型信息决定了答案抽取策略。 本文针对文本分类和问题分类的差别,利用依存分析提取主干和疑问词及其附属成分,并结合主干关联词对,采用支持向量机分类器,此方法大大减少了问题分类的噪音,突出了问题分类的主要特征,并考虑了词与词之间的句法关系,取得了良好效果;同时,针对普通层次分类在问题分类上效果不理想的情况,本文提出了类别主特征结合句法特征的中文问题层次分类新思想,利用句法分析提取分类特征,在问题分类中融入了句法信息,总的准确率达到大类88.25%和小类73.15%,比传统的层次分类分别提高了10个百分点,证明了此方法的有效性。 候选答案句抽取是问答系统中答案抽取的重要组成部分,其质量直接影响问答系统的性能。针对文本检索和句子检索之间的区别,本文主要采用指代消解预处理,改进的编辑距离与向量空间模型相结合的方法,对factoid问题的答案句检索效果显著,准确率为84.71%。答案句确认主要通过对问句和候选答案句的树形结构匹配,把句子的句法信息融入到候选句的抽取中,在一定程度上克服了简单词袋模型的缺点,并提出简化而有效的树形结构匹配算法——先根遍历后改进编辑距离的新方法,准确率和召回率分别提高了6.2和7.7个百分点。
【学位授予单位】:哈尔滨工业大学
【学位级别】:硕士
【学位授予年份】:2006
【分类号】:TP18;TP391.1

【引证文献】
中国期刊全文数据库 前2条
1 黄建岗;张爱华;;教务门户网自动问答系统的设计与实现[J];电脑知识与技术;2009年36期
2 杨皓东;江凌;李国俊;;国内自然语言处理研究热点分析——基于共词分析[J];图书情报工作;2011年10期
中国硕士学位论文全文数据库 前5条
1 张可培;基于阅读理解模式的中文问答系统研究[D];宁波大学;2011年
2 刘慧敏;一种基于本体的自动答疑系统框架研究[D];重庆大学;2011年
3 张宏;基于本体的农业自动应答系统关键技术研究[D];河北农业大学;2007年
4 安强强;基于语义角色标注的中文问答系统研究[D];西北大学;2009年
5 王波;基于移动学习的智能答疑系统的研究与设计[D];东北师范大学;2009年
【参考文献】
中国期刊全文数据库 前8条
1 李静梅,孙丽华,张巧荣,张春生;一种文本处理中的朴素贝叶斯分类器[J];哈尔滨工程大学学报;2003年01期
2 秦兵,刘挺,王洋,郑实福,李生;基于常问问题集的中文问答系统研究[J];哈尔滨工业大学学报;2003年10期
3 王厚峰,何婷婷;汉语中人称代词的消解研究[J];计算机学报;2001年02期
4 王厚峰;指代消解的基本方法和实现技术[J];中文信息学报;2002年06期
5 郑实福,刘挺,秦兵,李生;自动问答综述[J];中文信息学报;2002年06期
6 张宇,刘挺,文勖;基于改进贝叶斯模型的问题分类[J];中文信息学报;2005年02期
7 吴友政,赵军,段湘煜,徐波;问答式检索技术及评测研究综述[J];中文信息学报;2005年03期
8 王晓宇,周傲英;万维网的链接结构分析及其应用综述[J];软件学报;2003年10期
【共引文献】
中国期刊全文数据库 前10条
1 乌庆敏;方少卿;谢亮亮;;一种加权的KNN中文问句分类方法研究[J];安徽广播电视大学学报;2010年03期
2 何甫权;;英语指代与翻译[J];安徽文学(下半月);2008年08期
3 段建勇;李俊;张梅;马礼;;限定领域的自动问答系统研究[J];北方工业大学学报;2010年01期
4 蒋宗礼;李宪雷;徐学可;;基于主题Hub值的元搜索[J];北京工业大学学报;2009年03期
5 刘文华;康海燕;;领域问答系统生成器的研究[J];北京信息科技大学学报(自然科学版);2009年03期
6 康海燕;李飞娟;苏文杰;;基于问句表征的web智能问答系统[J];北京信息科技大学学报(自然科学版);2011年01期
7 余正涛,樊孝忠,宋丽荣;基于特定问题类别的汉语问答系统查询扩展[J];北京理工大学学报;2005年10期
8 陈康;樊孝忠;刘杰;贾可亮;;基于问句语义表征的中文问句相似度计算方法[J];北京理工大学学报;2007年12期
9 刘小明;樊孝忠;李方方;;一种结合本体和焦点的问题分类方法[J];北京理工大学学报;2012年05期
10 吴敏;;指代消解在普通语言学理论与课程实践上的应用研究[J];大家;2010年11期
中国重要会议论文全文数据库 前10条
1 王治敏;俞士汶;;人称代词和名词的歧义消解研究[A];第六届汉语词汇语义学研讨会论文集[C];2005年
2 熊文新;宋柔;;信息检索查询语句的表述分析[A];第四届全国语言文字应用学术研讨会论文集[C];2005年
3 刘艳芳;封化民;丁天昌;;中文视频问答系统研究[A];第二届和谐人机环境联合学术会议(HHME2006)——第15届中国多媒体学术会议(NCMT'06)论文集[C];2006年
4 张娟;王慧锋;;文本分类技术在海量金融信息处理中的应用[A];第二十四届中国控制会议论文集(下册)[C];2005年
5 于娟;武港山;;面向政府公文领域的中文问题分类[A];2008年中国高校通信类院系学术研讨会论文集(下册)[C];2009年
6 刘国刚;;人工智能客户服务体系的研究与实现[A];2008年中国通信学会无线及移动通信委员会学术年会论文集[C];2008年
7 谭斌;;指代消解的原理和实现方法[A];2008'中国信息技术与应用学术论坛论文集(二)[C];2008年
8 俞士汶;;计算语言学的应用研究与基础研究[A];辉煌二十年——中国中文信息学会二十周年学术会议论文集[C];2001年
9 杨佳;;基于语料分析的“这/那+NP”的指代消解算法[A];第二届全国学生计算语言学研讨会论文集[C];2004年
10 郎君;刘挺;秦兵;;基于决策树的中文名词短语指代消解[A];第二届全国学生计算语言学研讨会论文集[C];2004年
中国博士学位论文全文数据库 前10条
1 殷志伟;基于统计学习理论的分类方法研究[D];哈尔滨工程大学;2009年
2 张巍;融合FAQ、本体和推理技术的问答系统研究[D];太原理工大学;2011年
3 黄莉;基于语义关联的重复数据清理技术研究[D];华中科技大学;2011年
4 倪兴良;问答系统中的短文本聚类研究与应用[D];中国科学技术大学;2011年
5 杨抒;基于WEB的林产品信息资源整合方法研究[D];北京林业大学;2011年
6 杜萍;基于本体的中国行政区划地名识别与抽取研究[D];兰州大学;2011年
7 刘玉国;基于内容的互联网舆情信息挖掘关键技术研究[D];山东大学;2011年
8 邱明波;动词的指向对汉语第三人称代词和反身代词的句内回指的制约[D];复旦大学;2011年
9 邓小龙;基于复杂网络分析的新一代电信CRM关键技术研究[D];北京邮电大学;2011年
10 罗建宏;粒计算分类知识发现算法及其应用[D];浙江大学;2010年
中国硕士学位论文全文数据库 前10条
1 王芳;基于EVS相似度的邮件社区划分方法研究[D];郑州大学;2010年
2 张士军;基于随机游走的网页协同排序算法研究[D];大连理工大学;2010年
3 金璐钰;基于框架的事件抽取关键技术研究[D];苏州大学;2010年
4 冯晶晶;面向软件测试领域的自动问答系统[D];河南理工大学;2010年
5 王有权;基于Web的智能答疑技术研究与实现[D];南京财经大学;2010年
6 范春晓;基于XML的Web信息抽取技术研究[D];沈阳理工大学;2010年
7 周登;基于N-Gram模型的藏文文本分类技术研究[D];西北民族大学;2010年
8 杨鼎;基于朴素贝叶斯的中文文本情感倾向分类研究[D];湖南工业大学;2010年
9 杨朝玉;基于知网的受限域问答系统原型的设计与实现[D];华南理工大学;2010年
10 韩露;领域知识对领域问答系统答案抽取影响研究[D];昆明理工大学;2008年
【同被引文献】
中国期刊全文数据库 前10条
1 陶皖,李平,廖述梅;当前基于本体的语义标注工具的分析[J];安徽工程科技学院学报(自然科学版);2005年02期
2 段建勇;李俊;张梅;马礼;;限定领域的自动问答系统研究[J];北方工业大学学报;2010年01期
3 龚书;瞿有利;田盛丰;;基于语义的自动文摘研究综述[J];北京交通大学学报;2009年05期
4 邓志鸿,唐世渭,张铭,杨冬青,陈捷;Ontology研究综述[J];北京大学学报(自然科学版);2002年05期
5 许云,樊孝忠,张锋;基于知网的语义相关度计算[J];北京理工大学学报;2005年05期
6 余正涛,樊孝忠,宋丽荣;基于特定问题类别的汉语问答系统查询扩展[J];北京理工大学学报;2005年10期
7 谢桂芳;;SPARQL-一种新型的RDF查询语言[J];湘南学院学报;2009年02期
8 柳泉波,黄荣怀,何克抗;智能答疑系统的设计与实现[J];中国远程教育;2000年08期
9 孙耀庭;;移动学习和移动服务的实践与研究[J];中国远程教育;2008年08期
10 叶成林,徐福荫,许骏;移动学习研究综述[J];电化教育研究;2004年03期
中国博士学位论文全文数据库 前9条
1 郭永洪;基于本体的鱼病知识获取与诊断推理集成系统研究[D];中国农业大学;2004年
2 李景;本体理论及在农业文献检索系统中的应用研究——以花卉学本体建模为例[D];中国科学院研究生院(文献情报中心);2004年
3 常春;Ontology在农业信息管理中的构建和转化[D];中国农业科学院;2004年
4 杜永萍;基于模式知识库的问题回答关键技术研究[D];复旦大学;2005年
5 张亮;面向开放域的中文问答系统问句处理相关技术研究[D];南京理工大学;2006年
6 王树西;基于文本模式推理的问答系统研究[D];中国科学院研究生院(计算技术研究所);2005年
7 黄涛;知识服务的语义匹配机制研究[D];华中师范大学;2007年
8 徐晓华;图上的随机游走学习[D];南京航空航天大学;2008年
9 吴刚;RDF图数据管理的关键技术研究[D];清华大学;2008年
中国硕士学位论文全文数据库 前10条
1 赵赟;基于本体的问答查询系统关键技术的研究与实现[D];东南大学;2004年
2 付卉;移动学习系统的设计与开发[D];华中师范大学;2005年
3 郑丽萍;本体映射的研究[D];山东科技大学;2005年
4 曹志娟;自动问答系统中的问题理解与信息检索研究[D];重庆大学;2005年
5 陈建;领域本体的创建和应用研究[D];对外经济贸易大学;2006年
6 王慧慧;基于自然语言处理的问答系统研究[D];电子科技大学;2006年
7 屈静;多平台移动终端网络应用开发的研究和实现[D];北京邮电大学;2006年
8 罗耀华;移动学习模型分析及移动英语平台的设计和开发[D];四川师范大学;2006年
9 张佳;基于ontology的领域知识库的构建与集成实现[D];贵州大学;2006年
10 孙景广;基于网络的自动问答系统的答案抽取方法研究[D];沈阳航空工业学院;2007年
【二级引证文献】
中国期刊全文数据库 前6条
1 余明朗;明小娜;龙毅;张雪英;;GIS环境下中文命令的规则匹配与语义解析[J];地理与地理信息科学;2012年06期
2 贾利军;管静娟;杨娅蓓;;我国就业能力的研究热点及其解析[J];华东师范大学学报(哲学社会科学版);2013年05期
3 郑永晓;;情感计算应用于古典诗词研究刍议[J];科研信息化技术与应用;2012年04期
4 路青;崔新春;胡艳波;;基于文献计量的国内语义角色标注研究现状分析[J];情报杂志;2012年04期
5 李秀霞;邵作运;郑春厚;;我国图书情报界PIS研究的共词可视化分析[J];情报杂志;2012年08期
6 梁晓婷;奉国和;;当代知识图谱的构建方法研究[J];图书馆杂志;2013年05期
中国硕士学位论文全文数据库 前10条
1 杨朝玉;基于知网的受限域问答系统原型的设计与实现[D];华南理工大学;2010年
2 赵素娟;基于互联网的人物简历问答系统的研究与设计[D];东北财经大学;2010年
3 王少华;基于手机的课程答疑系统的设计与实现[D];宁波大学;2011年
4 贾永;农家书屋数字化平台的自动应答模块分析与设计[D];贵州财经学院;2012年
5 王聃;农业问题的专家诱导型提问模型研究[D];河北农业大学;2008年
6 董晓霞;智能化农业信息服务系统关键技术的研究[D];河北农业大学;2009年
7 卜文娟;基于概念图的中文问答系统的研究与实现[D];西北大学;2010年
8 吴麦芳;基于领域本体的蚜虫天敌知识体系构建研究[D];西北农林科技大学;2010年
9 王丛林;在线自动答疑系统设计与开发的研究[D];东北师范大学;2010年
10 路青;基于特征选择的中文语义角色标注研究[D];曲阜师范大学;2012年
【二级参考文献】
中国期刊全文数据库 前8条
1 秦洪武;第三人称代词在深层回指中的应用分析[J];当代语言学;2001年01期
2 秦兵;刘挺;王洋;郑实福;李生;;基于常问问题集的中文问答系统研究[J];哈尔滨工业大学学报;2003年10期
3 王厚峰;;句类中E块的作用及其判定策略[J];计算机科学;2000年05期
4 王厚峰,何婷婷;汉语中人称代词的消解研究[J];计算机学报;2001年02期
5 郑实福,刘挺,秦兵,李生;自动问答综述[J];中文信息学报;2002年06期
6 崔桓,蔡东风,苗雪雷;基于网络的中文问答系统及信息抽取算法研究[J];中文信息学报;2004年03期
7 刘志文,郝惠宁,肖友芙,黄曾阳;自然语言语句的HNC表示[J];语言文字应用;1998年02期
8 黄曾阳;HNC理论与自然语言语句的理解[J];中国基础科学;1999年Z1期
中国重要会议论文全文数据库 前1条
1 吴友政;赵军;段湘煜;徐波;;构建汉语问答系统评测平台[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
【相似文献】
中国期刊全文数据库 前10条
1 张亮;黄河燕;胡春玲;;基于Ontology的中文问答系统问题分类研究[J];中国图书馆学报;2006年02期
2 吕德新;张桂平;蔡东风;余超;;基于语义信息的问题分类[J];沈阳航空工业学院学报;2006年03期
3 李婷玉;葛正荣;姚天昉;;汉语情感问题类型分类研究[J];中文信息学报;2011年02期
4 郑实福,刘挺,秦兵,李生;自动问答综述[J];中文信息学报;2002年06期
5 战学刚;伏圣国;迟呈英;;改进的基于模式匹配的答案抽取方法[J];情报理论与实践;2009年09期
6 卢炳卫;;关于自动问答技术的研究[J];农业图书情报学刊;2006年01期
7 李季;一个标准中文问答系统的研究与实现[J];计算机系统应用;2004年06期
8 张晓孪;王西锋;李乃乾;;中文问答系统中问题理解的研究与实现[J];西华大学学报(自然科学版);2008年02期
9 刘汉兴;林旭东;田绪红;;基于本体的自动答疑系统的研究与实现[J];计算机应用;2010年02期
10 张莉;刘雅举;李东明;侯晨伟;;中文问句分类系统的分析[J];科技情报开发与经济;2007年25期
中国重要会议论文全文数据库 前10条
1 张宇;刘挺;文勖;;基于改进贝叶斯模型的问题分类[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
2 文勖;张宇;刘挺;;类别主特征结合句法特征的中文问题层次分类[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年
3 张亮;陈肇雄;黄河燕;;基于ontology的问答系统问题分类研究[A];第六届汉语词汇语义学研讨会论文集[C];2005年
4 葛正荣;李婷玉;姚天昉;;汉语情感问题类型分类研究[A];第五届全国青年计算语言学研讨会论文集[C];2010年
5 于娟;武港山;;面向政府公文领域的中文问题分类[A];2008年中国高校通信类院系学术研讨会论文集(下册)[C];2009年
6 何靖;陈翀;闫宏飞;;开放域问答系统研究综述[A];第六届全国信息检索学术会议论文集[C];2010年
7 赵兴;余正涛;邹俊杰;郭剑毅;毛存礼;;结合依存句法与实体的领域答案句模学习方法[A];中国自动化学会控制理论专业委员会A卷[C];2011年
8 李茹;王文晶;梁吉业;宋小香;刘海静;由丽萍;;基于汉语框架网的旅游信息问答系统设计[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
9 孙景广;蔡东风;吕德新;董燕举;;基于知网的中文问题自动分类[A];第三届学生计算语言学研讨会论文集[C];2006年
10 缪有栋;邱锡鹏;黄萱菁;;基于主动学习的中文问题类别标注研究[A];第六届全国信息检索学术会议论文集[C];2010年
中国重要报纸全文数据库 前10条
1 记者 谢平;绥滨 突出问题分类挂号督办[N];黑龙江日报;2009年
2 记者 王冬梅;走访分类 问题分类 处置分类[N];组织人事报;2011年
3 李学文;呈贡县人大信访问题分类办理[N];云南日报;2006年
4 记者 张晋国;采暖器材和电视购物成投诉热点[N];中国工商报;2008年
5 樵世稳;元子街镇以人为本防大汛[N];商洛日报;2008年
6 本报记者 李英姿实习生 邓昌荣 王辉;建设“难题”分类交办[N];衡阳日报;2008年
7 本报记者 姜泓冰 整理;大学应让人感受思想的魅力[N];人民日报;2011年
8 姚朝磊 徐兴波;巨野县把整改落到实处[N];菏泽日报;2006年
9 通讯员  青华 慧娟;安徽:停建34个项目并限期整顿[N];中华建筑报;2006年
10 刘小友;高安市信访“赶集”解民忧[N];宜春日报;2008年
中国博士学位论文全文数据库 前10条
1 胡德鹏;基于农业本体问句分析的问答系统研究与架构设计[D];中国农业科学院;2013年
2 张志昌;开放域阅读理解关键技术研究[D];哈尔滨工业大学;2010年
3 黎新;面向问答系统的段落检索技术研究[D];中国科学技术大学;2010年
4 倪兴良;问答系统中的短文本聚类研究与应用[D];中国科学技术大学;2011年
5 张巍;融合FAQ、本体和推理技术的问答系统研究[D];太原理工大学;2011年
6 宋万鹏;短文本相似度计算在用户交互式问答系统中的应用[D];中国科学技术大学;2010年
7 路遥;用户交互式问答系统中问题推荐机制的研究[D];中国科学技术大学;2012年
8 邸书灵;Agent联盟和流形学习在中文问答系统中的应用研究[D];天津大学;2010年
9 呼大为;面向问答系统的答案获取方法研究与实现[D];中国科学技术大学;2008年
10 刘朝涛;中文问答系统中的句型理论及其应用研究[D];重庆大学;2010年
中国硕士学位论文全文数据库 前10条
1 文勖;中文问答系统中问题分类及答案候选句抽取的研究[D];哈尔滨工业大学;2006年
2 卜文娟;基于概念图的中文问答系统的研究与实现[D];西北大学;2010年
3 刘祥;基于课程知识的问答系统研究与应用[D];大连海事大学;2010年
4 黄波;中文问答系统中答案抽取的研究与实现[D];吉林大学;2010年
5 高艳影;中文问答系统中的问题分类研究[D];合肥工业大学;2011年
6 刘桥妹;基于开放域问答系统的问题分类技术研究与实现[D];华南理工大学;2010年
7 赵辄谦;基于互联网的中文问答系统研究[D];山西大学;2003年
8 张诚;基于领域知识的限定域中文问答系统研究[D];上海交通大学;2010年
9 牛彦清;中文问答系统的问句分类研究[D];太原理工大学;2011年
10 冯晓波;中文问答系统中问题分类和关键词扩展的研究[D];北京邮电大学;2011年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026