收藏本站
《中国科学技术大学》 2008年
收藏 | 手机打开
二维码
手机客户端打开本文

面向问答系统的答案获取方法研究与实现

呼大为  
【摘要】: 互联网的发展使人们能够在互联网这个平台上方便地保存数据、交流信息以及共享知识。人类日常所需的大部分知识,均可利用互联网得到。在现阶段,人们大多通过搜索引擎从互联网中寻找所需知识。但是,搜索引擎只允许用户通过若干关键词描述需求并且只能返回与这些关键词相关的信息,用户需花费大量时间从中寻找所需知识。为了改善这种状况,问答系统(Question Answering System)逐渐成为研究热点。该系统接收用户所提出的各种问题,直接获取高质量的答案返回用户。相比搜索引擎,问答系统允许用户将所需信息以问题的形式描述出来,这些问题比关键词包含更多的语义信息,能够更加准确地描述用户的需求。 问答系统可分为自动问答系统和交互式问答系统。其中,自动问答系统主要利用基于语义匹配的答案获取方法,首先对问题进行语义分析,而后从数据源抽取与问题所问事物的语义特征相一致的信息,将其作为答案返回用户;交互式问答系统主要利用基于问题推荐的答案获取方法,通过分析用户模型,将问题推荐至合适的用户处。本文围绕这两种不同的答案获取方法,对如何加强问题的语义分析能力、提高相关文档的抓取质量、增加答案的抽取速度和准确率以及优化问题的推荐策略等内容进行了深入研究,以提高问答系统的问题回答率和答案正确率。本文的主要研究内容和创新之处如下: 首先,提出了一种新型的问题模板粒度评估策略SIIPU(SemanticIdentifiability Inverse Pattern Universality),并以SIIPU为基础给出了一种有效的问题模板学习算法SIIPU*S。SIIPU能够分析出不同粒度的语法约束信息对问题语义进行分析时的不同效果,进而根据实际需求选择合适的语法约束构建问题模板,以保证学得的问题模板在能够准确分析问题语义的前提下,处理尽量多的问题。 其次,提出了一种基于查询重写的段落抽取方法以快速获取若干与问题相关的段落。该方法利用启发式的查询生成策略,能够将问题转换为几组高质量的查询,这些查询能够较为准确地刻画用户需求。此外,通过基于模板的问题特征抽取策略,根据每个关键词在问题中的不同角色定制对应的权重,以便在抽取段落时,能够提高包含“重要”词语的段落被抽取到的概率。 再次,提出了一种基于动态模板的答案抽取方法。该方法利用启发式的信息抽取规则学习算法HRL(Heuristic Rule Learning),从用户标注过的文档训练集中抽取出高质量的信息抽取规则。此外,利用问题的分析结果,能够选择适当的抽取规则动态生成若干与该问题相对应的答案模板,以便从与问题相关的段落中抽取准确答案。 最后,提出一种基于负载平衡的问题推荐策略。该机制通过分析用户的信誉度以及对各个领域的兴趣度和权威性,为其推荐相关问题。同时,所有待解决的问题会依照其重要程度被依次推荐,以保证重要问题能够被优先推荐。并且,问题被尽量平摊至不同的用户,以调动每位用户的参与度。此外,紧急的问题会被推荐至积极性较高的领域专家处,以确保能够被及时回答。 在上述工作基础上,本文实现了两个问答原型系统。实验结果表明所提出的方法有效提高了问答系统的效率。
【学位授予单位】:中国科学技术大学
【学位级别】:博士
【学位授予年份】:2008
【分类号】:TP391.3

手机知网App
【参考文献】
中国期刊全文数据库 前7条
1 孙茂松,邹嘉彦;汉语自动分词研究评述[J];当代语言学;2001年01期
2 张鹏,李梦辉,吴金闪,狄增如,樊瑛;科学家合作网络的聚类分析[J];复杂系统与复杂性科学;2005年02期
3 郑实福,刘挺,秦兵,李生;自动问答综述[J];中文信息学报;2002年06期
4 吴友政,赵军,段湘煜,徐波;问答式检索技术及评测研究综述[J];中文信息学报;2005年03期
5 赵一唯,王和珍,李振东;WWW信息检索综述[J];南京大学学报(自然科学版);2001年02期
6 康平立;许雯燕;江丽萍;;韦林分布及其参数估计方法的运用[J];统计与决策;2007年17期
7 邓尚民;孙玉伟;;信息抽取系统的研究现状[J];现代图书情报技术;2006年03期
【共引文献】
中国期刊全文数据库 前10条
1 段建勇;李俊;张梅;马礼;;限定领域的自动问答系统研究[J];北方工业大学学报;2010年01期
2 冀俊忠,沙志强,刘椿年,郎青;B2C电子商务站点中知识发现的研究[J];北京工业大学学报;2003年02期
3 马志强;周长胜;丁维;杨娜;;校园网搜索引擎的研究与实现[J];北京机械工业学院学报;2007年01期
4 刘文华;康海燕;;领域问答系统生成器的研究[J];北京信息科技大学学报(自然科学版);2009年03期
5 李国和;刘光胜;吴卫江;孙红军;唐先明;韩宝东;;基于最大匹配和歧义检测的中文分词粗分方法[J];北京信息科技大学学报(自然科学版);2010年S2期
6 康海燕;李飞娟;苏文杰;;基于问句表征的web智能问答系统[J];北京信息科技大学学报(自然科学版);2011年01期
7 余正涛,樊孝忠,宋丽荣;基于特定问题类别的汉语问答系统查询扩展[J];北京理工大学学报;2005年10期
8 刘小明;樊孝忠;李方方;;一种结合本体和焦点的问题分类方法[J];北京理工大学学报;2012年05期
9 何兴无;;用户兴趣实例模型与K_means算法的改进[J];重庆师范大学学报(自然科学版);2006年02期
10 秦超;;远程教学平台中开放式综合答疑系统研究[J];中国远程教育;2006年10期
中国重要会议论文全文数据库 前10条
1 贾会强;刘晓丽;于洪志;;基于词性特征提取的藏文文本分类方法研究[A];CCF NCSC 2011——第二届中国计算机学会服务计算学术会议论文集[C];2011年
2 王慧慧;杨国纬;;基于事例的问答系统研究[A];贵州制约逻辑学会2005年学术年会暨首届全国性逻辑系统专题研讨会论文集[C];2005年
3 熊文新;宋柔;;信息检索查询语句的表述分析[A];第四届全国语言文字应用学术研讨会论文集[C];2005年
4 陈晓;;中文文本自动分词研究述要[A];第四届全国语言文字应用学术研讨会论文集[C];2005年
5 刘艳芳;封化民;丁天昌;;中文视频问答系统研究[A];第二届和谐人机环境联合学术会议(HHME2006)——第15届中国多媒体学术会议(NCMT'06)论文集[C];2006年
6 赵琦;骆志刚;田文颖;李聪;丁凡;;一种基于负反馈信息的用户兴趣模型修正方法[A];中国通信学会第六届学术年会论文集(下)[C];2009年
7 方锦清;汪小帆;郑志刚;;非线性网络的动力学复杂性研究的进展概况[A];第四届全国网络科学学术论坛暨研究生暑期学校论文集[C];2008年
8 许超;陈小荷;;试评两种商用机译软件的汉语分析能力[A];机器翻译研究进展——2002年全国机器翻译研讨会论文集[C];2002年
9 黄昌宁;高剑峰;李沐;;对自动分词的反思[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
10 王厚峰;;机器翻译中汉语词节点的识别[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
中国博士学位论文全文数据库 前10条
1 樊建聪;分布估计学习算法研究[D];山东科技大学;2010年
2 张寅;个性化技术及其在数字图书馆中应用的研究[D];浙江大学;2009年
3 渠瑜;基于SVM的高不平衡分类技术研究及其在电信业的应用[D];浙江大学;2010年
4 李一啸;基于复杂网络和演化博弈理论的社会[D];浙江大学;2010年
5 张巍;融合FAQ、本体和推理技术的问答系统研究[D];太原理工大学;2011年
6 李艳文;信号Pathway预测方法研究[D];吉林大学;2011年
7 靳延安;社会标签推荐技术与方法研究[D];华中科技大学;2011年
8 倪兴良;问答系统中的短文本聚类研究与应用[D];中国科学技术大学;2011年
9 张海军;基于大规模语料的中文新词识别技术研究[D];中国科学技术大学;2011年
10 杨抒;基于WEB的林产品信息资源整合方法研究[D];北京林业大学;2011年
中国硕士学位论文全文数据库 前10条
1 孙岭;一种基于前缀表达式的Web信息抽取方法的关键问题的实现[D];山东科技大学;2010年
2 何莹杰;个性化图书信息服务技术研究[D];哈尔滨工程大学;2010年
3 李春;协同过滤推荐算法的研究[D];湘潭大学;2010年
4 冯晶晶;面向软件测试领域的自动问答系统[D];河南理工大学;2010年
5 宋健;基于主题挖掘和时间窗口划分的兴趣推荐技术研究[D];华东师范大学;2011年
6 王有权;基于Web的智能答疑技术研究与实现[D];南京财经大学;2010年
7 范春晓;基于XML的Web信息抽取技术研究[D];沈阳理工大学;2010年
8 杨鼎;基于朴素贝叶斯的中文文本情感倾向分类研究[D];湖南工业大学;2010年
9 杨朝玉;基于知网的受限域问答系统原型的设计与实现[D];华南理工大学;2010年
10 金亚亚;一种基于改进信任度的协同过滤算法[D];华东理工大学;2011年
【二级参考文献】
中国期刊全文数据库 前10条
1 戴汝为,操龙兵;Internet——一个开放的复杂巨系统[J];中国科学E辑:技术科学;2003年04期
2 孙茂松,黄昌宁,邹嘉彦,陆方,沈达阳;利用汉字二元语法关系解决汉语自动分词中的交集型歧义[J];计算机研究与发展;1997年05期
3 阳小华;周龙骧;;World Wide Web的索引与查询技术[J];计算机科学;1997年06期
4 马红妹;谭庆平;陈火旺;;基于Push技术的信息获取方式及其应用[J];计算机科学;1999年03期
5 陈智健;;WWW上Meta-Search的研究与实现[J];计算机科学;1999年04期
6 王晓龙,王开铸,李仲荣,白小华;最少分词问题及其解法[J];科学通报;1989年13期
7 刘源,梁南元;汉语处理的基础工程——现代汉语词频统计[J];中文信息学报;1986年01期
8 梁南元;书面汉语自动分词系统—CDWS[J];中文信息学报;1987年02期
9 刘涌泉;再读词的问题[J];中文信息学报;1988年02期
10 李国臣,刘开瑛,张永奎;汉语自动分词及歧义组合结构的处理[J];中文信息学报;1988年03期
中国重要会议论文全文数据库 前1条
1 吴友政;赵军;段湘煜;徐波;;构建汉语问答系统评测平台[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
【相似文献】
中国期刊全文数据库 前10条
1 党琰,张冬茉,李芳;角色反演算法在问答系统中的应用[J];计算机工程与应用;2004年36期
2 张晓孪;王西锋;;中文问答系统中语义角色标注的研究与实现[J];科学技术与工程;2008年10期
3 秦兵,刘挺,王洋,郑实福,李生;基于常问问题集的中文问答系统研究[J];哈尔滨工业大学学报;2003年10期
4 付鸿鹄;基于W eb的开放领域问答系统研究[J];现代图书情报技术;2005年09期
5 高明霞;刘椿年;;基于模糊描述逻辑的PNL网络问答系统[J];计算机工程;2006年21期
6 王树西;赵星秋;潘硕;;问答系统在教学中的应用[J];中国教育信息化;2007年07期
7 杜玮;邸书灵;孙树静;;基于互联网技术的问答系统研究[J];微计算机信息;2007年36期
8 陈敏杰;;问答系统中问题分析模块的实现[J];经营管理者;2009年13期
9 李东园;白宇;蔡东风;;面向中文问答的信息检索系统及评测[J];沈阳航空工业学院学报;2009年03期
10 李季;一个标准中文问答系统的研究与实现[J];计算机系统应用;2004年06期
中国重要会议论文全文数据库 前10条
1 何靖;陈翀;闫宏飞;;开放域问答系统研究综述[A];第六届全国信息检索学术会议论文集[C];2010年
2 栗振江;杨洋;李丽;;智能问答系统[A];2011年全国通信安全学术会议论文集[C];2011年
3 王树西;刘群;白硕;王斌;程学旗;姜吉发;;基于动态知识库的问答系统研究[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
4 张琼;陈群秀;;面向网络的问答系统研究综述[A];第一届学生计算语言学研讨会论文集[C];2002年
5 毛存礼;余正涛;线岩团;郭剑毅;雷雄丽;;基于短信的旅游景点酒店问答系统研究[A];中国自动化学会控制理论专业委员会A卷[C];2011年
6 于士涛;袁晓洁;师建兴;杨娜;;一种Web问答系统中基于XML片段的语义项模型[A];第二十四届中国数据库学术会议论文集(研究报告篇)[C];2007年
7 栾家阳;张文波;姚天昉;;基于汽车领域的情感问答系统设计与实现[A];第五届全国青年计算语言学研讨会论文集[C];2010年
8 葛正荣;李婷玉;姚天昉;;汉语情感问题类型分类研究[A];第五届全国青年计算语言学研讨会论文集[C];2010年
9 张宇;刘挺;文勖;;基于改进贝叶斯模型的问题分类[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
10 王树西;白硕;;中文问答系统中的模式推理[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年
中国重要报纸全文数据库 前10条
1 张丽娜 记者 孙悦群;依兰投资60万创建农业科技信息平台[N];黑龙江经济报;2006年
2 郑鸿海叶聿辉;轻点鼠标 要点尽览[N];人民公安报;2007年
3 ;腾讯网2007证券中国投资论坛在京举办[N];财会信报;2007年
4 本报记者 祝蕾 见习记者 许凯;李晓戈:努力缩小国内外数字“鸿沟”[N];济南日报;2010年
5 本报记者 朱文利 熊雯琳 本报美国特约记者Andriy Cole;人机大战,沃森赢了 它还只是一台电脑吗?[N];电脑报;2011年
6 郑杏果;林永青:不要问我盈利模式![N];中国计算机报;2006年
7 陈沛 刘学习编译;门户与搜索日渐融合[N];计算机世界;2006年
8 黄锴;团购网的线下体验[N];21世纪经济报道;2008年
9 记者 刘传书;微软在深圳设实验室[N];科技日报;2006年
10 ;捷通力推迷你型声讯服务[N];中国计算机报;2000年
中国博士学位论文全文数据库 前10条
1 胡德鹏;基于农业本体问句分析的问答系统研究与架构设计[D];中国农业科学院;2013年
2 倪兴良;问答系统中的短文本聚类研究与应用[D];中国科学技术大学;2011年
3 路遥;用户交互式问答系统中问题推荐机制的研究[D];中国科学技术大学;2012年
4 黎新;面向问答系统的段落检索技术研究[D];中国科学技术大学;2010年
5 张巍;融合FAQ、本体和推理技术的问答系统研究[D];太原理工大学;2011年
6 宋万鹏;短文本相似度计算在用户交互式问答系统中的应用[D];中国科学技术大学;2010年
7 邸书灵;Agent联盟和流形学习在中文问答系统中的应用研究[D];天津大学;2010年
8 夏天;研究性学习支持系统[D];华东师范大学;2007年
9 胡国平;基于超大规模问答对库和语音界面的非受限领域自动问答系统研究[D];中国科学技术大学;2007年
10 张显;信息距离理论及其在问答系统中的应用研究[D];清华大学;2008年
中国硕士学位论文全文数据库 前10条
1 卜文娟;基于概念图的中文问答系统的研究与实现[D];西北大学;2010年
2 刘祥;基于课程知识的问答系统研究与应用[D];大连海事大学;2010年
3 李旭锋;中文问答系统中问句理解和相似度计算的研究与实现[D];华南理工大学;2010年
4 刘渊杰;社区问答系统最佳回答机制的研究[D];上海交通大学;2010年
5 胡家豪;基于互联网的WEB舆情问答系统[D];电子科技大学;2011年
6 孙林;基于在线论坛的问答对识别研究与问答系统实现[D];哈尔滨工业大学;2010年
7 高艳影;中文问答系统中的问题分类研究[D];合肥工业大学;2011年
8 张诚;基于领域知识的限定域中文问答系统研究[D];上海交通大学;2010年
9 张兰轩;基于潜在语义分析的大学概况中文问答系统[D];大连理工大学;2004年
10 李畅;智能问答系统在高中物理教学中的应用[D];陕西师范大学;2011年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026