收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

问答系统中的文本信息抽取研究与应用

李欢  
【摘要】: 近年来,互联网的迅速发展,使得人们能够在这个平台上方便地保存数据、交流信息以及共享知识。但是,互联网中海量的数据给用户快速准确地获得这些所需的知识带来了困难。针对这样的需求,基于Web的信息检索和信息抽取逐渐成为了重要的研究课题。当搜索引擎的不足开始凸现,如何将丰富的资源合理地利用,使机器理解其中信息,成为网络时代机器智能的一大热门研究课题。在这样的背景下,建立在信息检索与信息抽取技术之上的问答技术领域蓬勃发展起来。问答系统以自然语言的问题取代关键字作为输入,允许用户准确表达自己的需求;将准确的答案短句返回给用户,节约了用户搜索、定位答案的时间。 问答系统按照获取答案的方式可以分为自动问答系统和交互式问答系统两种;根据系统所处理的问题的范围可以分为开放领域问答系统和特定领域问答系统两种。前者不限输入的问题范围,试图为任意主题内的任意问题寻找答案。后者只接受针对某一个特定领域的问题,往往有此领域内的领域知识作为指导。本文针对信息抽取在问答系统中的应用,围绕这两种不同的问答系统展开了研究。对开放领域内的问答,研究了如何加强对问题的语义分析能力、如何更有效地利用历史数据库以提高机器智能;对特定领域内的问答,研究了如何更好利用经验解决新的问题等,以提高问答系统的答案正确率。本文的主要研究内容和创新之处如下: 第一,对问题语义的准确分析是把握用户需求的关键。本文对文本中语义约束信息的识别展开了研究,期望对有信号词指示的语义约束部分,给出正确的检测,并对由同一信号词指示的多种语义约束,给出正确的区分。为此提出了一种运用依存关系树比对来检测文本中多语义约束的方法。对每一类语义约束,搜集信号词以及相应的例句组成案例库,并定义部分依存关系树(PDT)核函数来计算两个对象之间的相似度。在实际计算过程中,运用Apriori算法,来降低计算该核函数的复杂度。 第二,不管是自动问答系统还是交互式问答系统,都在日积月累的用户使用中积累了大量的问答数据。为了有效地重用这些历史数据,本文开展了从历史问答对中抽取知识的研究,期望将短文本答案的问答对蕴含的知识自动转化为结构化的知识表达,不断积累;并使得系统可以凭借积累的知识库进行查询检索,并返回结果。这样一是可以节约建造知识库的人力,二是可以对新问题给出一个参考答案,节约交互式系统中用户得到答案的时间。为此本文描述了从问答对到知识库转化的工作流程,将语义模板匹配和上述语义约束的识别的工作相结合,来获取对问题句中知识的提取,并运用以语义网络为基础的结构来表达互相联系互相约束的知识簇。实现了一个用户交互式的原型系统,演示了上述知识库积累和使用的过程。 第三,在特定领域内的自动问答中,领域知识起到非常关键的作用。在一些领域中,经验是解答新问题的最好的依据。因此,本文以植物生长环境的推荐任务为应用场景,对用基于案例推理的方法来重用该领域内的经验进行了研究。提出了一种学习获取修正规则的方法。运用资源空间模型(RSM)和语义链接网络(SLN)来表达和构建案例库,将案例之间相互联系起来。以案例比对的方法分析案例库,以得到修正规则;案例之间的联系和基本领域知识,给相似度计算提供了指导;运用距离测量值和置信度值来提高修正规则的生成和运用的精度;设计了一个进化模块,依据解决新问题的经验来更新修正规则集,提供了系统的学习能力。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 王宇;战学刚;蔡建山;;基于网络的中文问答系统的研究[J];计算机工程与应用;2006年07期
2 付鸿鹄;基于W eb的开放领域问答系统研究[J];现代图书情报技术;2005年09期
3 洪流;张巍;肖明军;蔡庆生;;一种改进的基于HMM的信息抽取模型[J];模式识别与人工智能;2004年03期
4 汤赛丽,郑逢斌;基于问题的面向对象知识表示方法的研究[J];现代计算机;2005年08期
5 王薇;朱凤;李欢;;基于Web的课程答疑系统的研究[J];中国成人教育;2008年22期
6 李中言,李普跃;信息抽取方法综述[J];廊坊师范学院学报;2005年03期
7 李昕;王红梅;;信息抽取技术探析[J];通化师范学院学报;2008年04期
8 魏保子;王儒敬;;基于多Agent技术的分布式信息抽取系统研究[J];微电子学与计算机;2008年06期
9 周霜菊,孙济庆;基于Agent的Web知识过滤器设计[J];计算机与数字工程;2005年03期
10 王健宗;;基于动态知识库的高考咨询问答系统研究[J];科技资讯;2006年01期
11 高明霞;刘椿年;;基于模糊描述逻辑的PNL网络问答系统[J];计算机工程;2006年21期
12 陈义;胡志宇;曾玮;吴相录;;税务业务咨询问答系统[J];计算机应用与软件;2007年02期
13 杨芙蓉;;论图书文献检索[J];内蒙古电大学刊;2007年12期
14 杜玮;邸书灵;孙树静;;基于互联网技术的问答系统研究[J];微计算机信息;2007年36期
15 王正;陆余良;刘金红;施凡;;基于Lucene的互联网文献信息检索系统的研究[J];安徽大学学报(自然科学版);2009年05期
16 高文利;;基于本体的军备情报抽取系统的设计与实现[J];现代图书情报技术;2010年01期
17 胡金化,胡运发,周益群,许爱华;面向中文文本数据库的信息抽取机制[J];小型微型计算机系统;2002年10期
18 邹荣;;对垂直搜索技术的分析[J];福建电脑;2009年02期
19 李向阳;苗壮;肖江;;无结构文本信息抽取综述[J];军事通信技术;2004年02期
20 齐嘉,傅骞;Web信息抽取技术在智能WAP网关中的应用[J];电信科学;2005年07期
中国重要会议论文全文数据库 前10条
1 梁涛;;呼叫中心发展趋势及实业呼叫中心应对[A];广东省通信学会2006年度学术论文集[C];2007年
2 刘国刚;;人工智能客户服务体系的研究与实现[A];2008年中国通信学会无线及移动通信委员会学术年会论文集[C];2008年
3 李宏利;雷雳;王争艳;;青少年在互联网使用中的时间知觉研究[A];第九届全国心理学学术会议文摘选集[C];2001年
4 康丽君;;网络时代与科技期刊的发展[A];2008年第四届中国科技期刊发展论坛论文集[C];2008年
5 于福洋;李朝旭;李颖;;当代中国人社会心态的互联网折射——来自抗震祈福留言的分析[A];中国社会心理学会2008年全国学术大会论文摘要集[C];2008年
6 贺宁武;孙志刚;;面向流媒体传输研究的StreamSim模拟器设计与实现[A];中国电子学会第十六届信息论学术年会论文集[C];2009年
7 汪明峰;;互联网与城市地理学:中国案例与研究进展[A];中国地理学会百年庆典学术论文摘要集[C];2009年
8 佐斌;;互联网对青少年心理与行为的影响[A];第九届全国心理学学术会议文摘选集[C];2001年
9 杨菊红;;科技期刊办刊应如何利用互联网上的资源[A];第三届中国科技期刊青年编辑学术研讨会论文集[C];2003年
10 程葳;;网络管理与构建和谐城市社会的关系[A];第二届城市科学论坛论文集[C];2006年
中国博士学位论文全文数据库 前10条
1 李欢;问答系统中的文本信息抽取研究与应用[D];中国科学技术大学;2009年
2 胡国平;基于超大规模问答对库和语音界面的非受限领域自动问答系统研究[D];中国科学技术大学;2007年
3 呼大为;面向问答系统的答案获取方法研究与实现[D];中国科学技术大学;2008年
4 倪兴良;问答系统中的短文本聚类研究与应用[D];中国科学技术大学;2011年
5 路遥;用户交互式问答系统中问题推荐机制的研究[D];中国科学技术大学;2012年
6 董宝力;Web制造资源的语义发现关键技术研究[D];浙江大学;2007年
7 刘亚清;开放式环境中的本体演化及其在信息抽取的应用研究[D];大连海事大学;2011年
8 黎新;面向问答系统的段落检索技术研究[D];中国科学技术大学;2010年
9 刘娜;文本自动摘要和信息抽取方法及其应用研究[D];大连海事大学;2012年
10 张巍;融合FAQ、本体和推理技术的问答系统研究[D];太原理工大学;2011年
中国硕士学位论文全文数据库 前10条
1 朱南丽;基于DOM的网页主体信息块抽取[D];昆明理工大学;2006年
2 范重庆;基于动态知识库的高考咨询问答系统研究[D];华中师范大学;2006年
3 卜文娟;基于概念图的中文问答系统的研究与实现[D];西北大学;2010年
4 赵辄谦;基于互联网的中文问答系统研究[D];山西大学;2003年
5 刘祥;基于课程知识的问答系统研究与应用[D];大连海事大学;2010年
6 高艳影;中文问答系统中的问题分类研究[D];合肥工业大学;2011年
7 陈玉;基于事实性问题中文问答系统的研究与实现[D];山西大学;2006年
8 李旭锋;中文问答系统中问句理解和相似度计算的研究与实现[D];华南理工大学;2010年
9 刘渊杰;社区问答系统最佳回答机制的研究[D];上海交通大学;2010年
10 张绍华;基于实例的Web信息抽取[D];河北大学;2001年
中国重要报纸全文数据库 前10条
1 本报记者 曹增光;互联网2.0时代已经到来?[N];中国经济时报;2005年
2 Google全球副总裁、大中华区总裁 李开复;迎接互联网明天的无限可能[N];计算机世界;2007年
3 ;帮助分支办公室改善互联网连接性能[N];网络世界;2008年
4 记者 吕冰冰 苏妮;深圳登录全球设计互联网[N];南方日报;2008年
5 记者 吴晓菁;重磅打造“互联网手机”[N];厦门日报;2009年
6 记者 赵陕雄;新一代互联网导航PDA打响价格战[N];中国质量报;2009年
7 本报记者 胡英;过滤互联网内容需采用新招[N];计算机世界;2009年
8 本报记者 梁靓;手机功能向互联网深度延伸[N];中国电子报;2009年
9 记者谢丽容;整治互联网低俗之风取得阶段性成果[N];通信产业报;2009年
10 本报记者 刘丽丽;航天信息 推动ERP与互联网联姻[N];计算机世界;2009年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978