收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

面向问答系统的答案获取方法研究与实现

呼大为  
【摘要】: 互联网的发展使人们能够在互联网这个平台上方便地保存数据、交流信息以及共享知识。人类日常所需的大部分知识,均可利用互联网得到。在现阶段,人们大多通过搜索引擎从互联网中寻找所需知识。但是,搜索引擎只允许用户通过若干关键词描述需求并且只能返回与这些关键词相关的信息,用户需花费大量时间从中寻找所需知识。为了改善这种状况,问答系统(Question Answering System)逐渐成为研究热点。该系统接收用户所提出的各种问题,直接获取高质量的答案返回用户。相比搜索引擎,问答系统允许用户将所需信息以问题的形式描述出来,这些问题比关键词包含更多的语义信息,能够更加准确地描述用户的需求。 问答系统可分为自动问答系统和交互式问答系统。其中,自动问答系统主要利用基于语义匹配的答案获取方法,首先对问题进行语义分析,而后从数据源抽取与问题所问事物的语义特征相一致的信息,将其作为答案返回用户;交互式问答系统主要利用基于问题推荐的答案获取方法,通过分析用户模型,将问题推荐至合适的用户处。本文围绕这两种不同的答案获取方法,对如何加强问题的语义分析能力、提高相关文档的抓取质量、增加答案的抽取速度和准确率以及优化问题的推荐策略等内容进行了深入研究,以提高问答系统的问题回答率和答案正确率。本文的主要研究内容和创新之处如下: 首先,提出了一种新型的问题模板粒度评估策略SIIPU(SemanticIdentifiability Inverse Pattern Universality),并以SIIPU为基础给出了一种有效的问题模板学习算法SIIPU*S。SIIPU能够分析出不同粒度的语法约束信息对问题语义进行分析时的不同效果,进而根据实际需求选择合适的语法约束构建问题模板,以保证学得的问题模板在能够准确分析问题语义的前提下,处理尽量多的问题。 其次,提出了一种基于查询重写的段落抽取方法以快速获取若干与问题相关的段落。该方法利用启发式的查询生成策略,能够将问题转换为几组高质量的查询,这些查询能够较为准确地刻画用户需求。此外,通过基于模板的问题特征抽取策略,根据每个关键词在问题中的不同角色定制对应的权重,以便在抽取段落时,能够提高包含“重要”词语的段落被抽取到的概率。 再次,提出了一种基于动态模板的答案抽取方法。该方法利用启发式的信息抽取规则学习算法HRL(Heuristic Rule Learning),从用户标注过的文档训练集中抽取出高质量的信息抽取规则。此外,利用问题的分析结果,能够选择适当的抽取规则动态生成若干与该问题相对应的答案模板,以便从与问题相关的段落中抽取准确答案。 最后,提出一种基于负载平衡的问题推荐策略。该机制通过分析用户的信誉度以及对各个领域的兴趣度和权威性,为其推荐相关问题。同时,所有待解决的问题会依照其重要程度被依次推荐,以保证重要问题能够被优先推荐。并且,问题被尽量平摊至不同的用户,以调动每位用户的参与度。此外,紧急的问题会被推荐至积极性较高的领域专家处,以确保能够被及时回答。 在上述工作基础上,本文实现了两个问答原型系统。实验结果表明所提出的方法有效提高了问答系统的效率。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 付鸿鹄;基于W eb的开放领域问答系统研究[J];现代图书情报技术;2005年09期
2 李志圣;孙越恒;何丕廉;候越先;;基于互联网和self-training的中文问答模式学习[J];计算机应用;2008年06期
3 王薇;朱凤;李欢;;基于Web的课程答疑系统的研究[J];中国成人教育;2008年22期
4 武琳;陈文婷;;基于Web搜索引擎的问答服务平台比较与评价[J];情报理论与实践;2009年03期
5 党琰,张冬茉,李芳;角色反演算法在问答系统中的应用[J];计算机工程与应用;2004年36期
6 张晓孪;王西锋;;中文问答系统中语义角色标注的研究与实现[J];科学技术与工程;2008年10期
7 秦兵,刘挺,王洋,郑实福,李生;基于常问问题集的中文问答系统研究[J];哈尔滨工业大学学报;2003年10期
8 高明霞;刘椿年;;基于模糊描述逻辑的PNL网络问答系统[J];计算机工程;2006年21期
9 王树西;赵星秋;潘硕;;问答系统在教学中的应用[J];中国教育信息化;2007年07期
10 杜玮;邸书灵;孙树静;;基于互联网技术的问答系统研究[J];微计算机信息;2007年36期
11 陈敏杰;;问答系统中问题分析模块的实现[J];经营管理者;2009年13期
12 李东园;白宇;蔡东风;;面向中文问答的信息检索系统及评测[J];沈阳航空工业学院学报;2009年03期
13 李季;一个标准中文问答系统的研究与实现[J];计算机系统应用;2004年06期
14 王国金,康耀红;基于布尔检索策略的问答系统性能研究[J];科技广场;2005年10期
15 黄莉;;浅析汉语问答系统中的句子检索方法[J];价值工程;2010年14期
16 卢志坚,张冬茉;基于事例的问句分析器[J];计算机仿真;2004年05期
17 李秋青;;基于问答(Q&A)系统原理的WAP信息检索[J];科技广场;2006年01期
18 张亮;王树梅;黄河燕;张孝飞;;面向中文问答系统的问句句法分析[J];山东大学学报(理学版);2006年03期
19 张莉;李东生;肖燕峰;;基于Web的受限领域问答系统研究及应用[J];电脑开发与应用;2007年05期
20 张莉;刘雅举;李东明;侯晨伟;;中文问句分类系统的分析[J];科技情报开发与经济;2007年25期
中国重要会议论文全文数据库 前10条
1 李宏利;雷雳;王争艳;;青少年在互联网使用中的时间知觉研究[A];第九届全国心理学学术会议文摘选集[C];2001年
2 梁涛;;呼叫中心发展趋势及实业呼叫中心应对[A];广东省通信学会2006年度学术论文集[C];2007年
3 康丽君;;网络时代与科技期刊的发展[A];2008年第四届中国科技期刊发展论坛论文集[C];2008年
4 于福洋;李朝旭;李颖;;当代中国人社会心态的互联网折射——来自抗震祈福留言的分析[A];中国社会心理学会2008年全国学术大会论文摘要集[C];2008年
5 贺宁武;孙志刚;;面向流媒体传输研究的StreamSim模拟器设计与实现[A];中国电子学会第十六届信息论学术年会论文集[C];2009年
6 汪明峰;;互联网与城市地理学:中国案例与研究进展[A];中国地理学会百年庆典学术论文摘要集[C];2009年
7 佐斌;;互联网对青少年心理与行为的影响[A];第九届全国心理学学术会议文摘选集[C];2001年
8 杨菊红;;科技期刊办刊应如何利用互联网上的资源[A];第三届中国科技期刊青年编辑学术研讨会论文集[C];2003年
9 程葳;;网络管理与构建和谐城市社会的关系[A];第二届城市科学论坛论文集[C];2006年
10 周海伦;;首钢总公司能源管理系统开发[A];中国计量协会冶金分会2007年会论文集[C];2007年
中国博士学位论文全文数据库 前10条
1 呼大为;面向问答系统的答案获取方法研究与实现[D];中国科学技术大学;2008年
2 李欢;问答系统中的文本信息抽取研究与应用[D];中国科学技术大学;2009年
3 倪兴良;问答系统中的短文本聚类研究与应用[D];中国科学技术大学;2011年
4 路遥;用户交互式问答系统中问题推荐机制的研究[D];中国科学技术大学;2012年
5 胡国平;基于超大规模问答对库和语音界面的非受限领域自动问答系统研究[D];中国科学技术大学;2007年
6 黎新;面向问答系统的段落检索技术研究[D];中国科学技术大学;2010年
7 张巍;融合FAQ、本体和推理技术的问答系统研究[D];太原理工大学;2011年
8 李祖明;互联网上的版权保护与限制[D];中国社会科学院研究生院;2002年
9 宋万鹏;短文本相似度计算在用户交互式问答系统中的应用[D];中国科学技术大学;2010年
10 邸书灵;Agent联盟和流形学习在中文问答系统中的应用研究[D];天津大学;2010年
中国硕士学位论文全文数据库 前10条
1 卜文娟;基于概念图的中文问答系统的研究与实现[D];西北大学;2010年
2 刘祥;基于课程知识的问答系统研究与应用[D];大连海事大学;2010年
3 李旭锋;中文问答系统中问句理解和相似度计算的研究与实现[D];华南理工大学;2010年
4 刘渊杰;社区问答系统最佳回答机制的研究[D];上海交通大学;2010年
5 胡家豪;基于互联网的WEB舆情问答系统[D];电子科技大学;2011年
6 孙林;基于在线论坛的问答对识别研究与问答系统实现[D];哈尔滨工业大学;2010年
7 高艳影;中文问答系统中的问题分类研究[D];合肥工业大学;2011年
8 张诚;基于领域知识的限定域中文问答系统研究[D];上海交通大学;2010年
9 张兰轩;基于潜在语义分析的大学概况中文问答系统[D];大连理工大学;2004年
10 李畅;智能问答系统在高中物理教学中的应用[D];陕西师范大学;2011年
中国重要报纸全文数据库 前10条
1 本报记者 曹增光;互联网2.0时代已经到来?[N];中国经济时报;2005年
2 Google全球副总裁、大中华区总裁 李开复;迎接互联网明天的无限可能[N];计算机世界;2007年
3 ;帮助分支办公室改善互联网连接性能[N];网络世界;2008年
4 记者 吕冰冰 苏妮;深圳登录全球设计互联网[N];南方日报;2008年
5 记者 吴晓菁;重磅打造“互联网手机”[N];厦门日报;2009年
6 记者 赵陕雄;新一代互联网导航PDA打响价格战[N];中国质量报;2009年
7 本报记者 胡英;过滤互联网内容需采用新招[N];计算机世界;2009年
8 本报记者 梁靓;手机功能向互联网深度延伸[N];中国电子报;2009年
9 记者谢丽容;整治互联网低俗之风取得阶段性成果[N];通信产业报;2009年
10 本报记者 刘丽丽;航天信息 推动ERP与互联网联姻[N];计算机世界;2009年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978