收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于自然语言与记忆再重构的常识推理模型

涂锟  
【摘要】:基于自然语言的文本信息处理和推理相结合的课题在最近十多年来扮演着越来越重要的角色,其应用范围涉及多个方面,比如广泛使用的网络搜索引擎,生物信息中基于文献的数据采集等等。研究者们使用基于统计的监督和半监督机器学习方法,通过已经注释的训练数据,可以得到很多高效的文本信息处理模型。然而,随着文本数据的日益增多,人为注释的数据却相对来说非常有限,而要把所有各个领域的数据都注释一遍不仅耗费的人力巨大,在时间上也是几乎行不通的。人们往往还得通过自己的知识,通过推理进一步筛选出自己需要的资料和概括文章的大意。另一方面,类似专家系统等一类的推理引擎(Inference engine),能够把某一具体领域的数据按照相关性逻辑地聚集一起。而这些数据之中的一部分,在另一些领域中也是合理的。因此,有必要把文本信息处理和推理引擎结合在一起,把某一领域的已注释文本数据利用推理引擎,扩充到其他领域中,并从中推断出新的信息,使得计算能够“理解”自然语言,减轻人们处理信息的负担。 本课题的研究主要通过自然语义处理和推理模型,模拟人脑对文本认知的过程,利用记忆再重构的理论,建立了一种能够对一些描述性的句子进行理解,分析,并作出反馈的智能推理系统。这些反馈是利用常识合理地推导出来的,在一定程度上减轻了人们筛选数据、提炼关键意思的负担。主要创新点包括: 1、建立一种词义消歧(word sense disambiguation)机制。在文章中,常常会出现多义词。人们通过上下文,很容易得到这些多义词的确切意思,然而对于机器来说,在文章中消除多义词的歧义,是一个棘手的问题。本文建立了新的词义消歧机制,结合当前广泛使用的WordNet和VerbNet数据库,通过上下文的内容来确定一个词的确切意思。 2、提出用于作为记忆模型的扩展型语义网络(extend semantic network,ESN)。传统的语义网络(Semantic Network)[1]仅仅能简单地表示概念实体以及相互之间的单一关系。本文提出的扩展型的语义网络,其顶点或边具有一系列属性,能够表达句子中复杂的意思。这种扩展型语义网络能很好的充当短期和长期记忆的模型,使得推理和记忆再重构顺利进行。 3、常识库、自然语言到贝叶斯置信网的转换机制。传统的推理引擎的输入数据需要人工从自然语言转换而来,推理的框架也需要人为地从常识和规律中搭建出来。本文的记忆模型能把信息自动从句子转换成推理引擎的数据,也能自动从常识库或者自然语言中学习推理规则构建贝叶斯置信网。 4、基于情景和主题的常识自适应选取和贝叶斯置信网实时动态组合机制。传统的推理引擎只能对某一固定领域的情形进行推理。本文的推理系统通过词汇disambiguation机制确定句子的情景和主题,自适应的选取常识来构建实时的贝叶斯执行网络,使得系统既能够恰当地推理相关信息,又能够降低贝叶斯网络的计算量,节约了时间。 5、基于记忆再重构(memory reconsolidation)的贝叶斯置信网参数优化和信息更新。记忆再重构是近年来认在知科学和神经科学提出来的一种新的发现。在实验过程中,认知科学研究者发现人脑记住的信息并不是一成不变的,而是在每次回忆以后,这些旧的记忆会因为结合新的记忆而发生变化(比如从小时候的照片构思出一个人当前的外貌而作为记忆存储下来)。根据这一理论,本文提出的自适应贝叶斯置信网能够根据新的记忆来改变其参数,并重新更新旧的记忆,达到优化推理的目的。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 胡蓉;词义消歧方法初探[J];洛阳工业高等专科学校学报;2005年01期
2 郭池 ,陈家骏 ,王启祥;一种基于语料库的词义消歧策略[J];计算机工程与应用;2003年35期
3 全昌勤,何婷婷,姬东鸿,刘辉;基于义类的无导词义消歧方法的研究[J];计算机应用研究;2005年04期
4 荀恩东,李生,赵铁军;基于汉语二元同现的统计词义消歧方法研究[J];高技术通讯;1998年10期
5 李生;张晶;赵铁军;姚建民;;词义消歧研究的现状与发展方向[J];计算机科学;2001年09期
6 全昌勤,何婷婷,姬东鸿,刘辉;从搭配知识获取最优种子的词义消歧方法[J];中文信息学报;2005年01期
7 李纲;寇广增;;自举在词义消歧中的应用及其关键问题[J];情报学报;2010年01期
8 陈浩;何婷婷;姬东鸿;;基于MDL聚类的无导词义消歧[J];小型微型计算机系统;2005年10期
9 张明宝;马静;;一种基于知网的中文词义消歧算法[J];计算机技术与发展;2009年02期
10 全昌勤,何婷婷,姬东鸿,刘辉;基于指示词的词义消歧方法[J];计算机工程;2005年16期
11 何婷婷;谢芳;;利用BP神经网络的中文词义消歧模型[J];华中师范大学学报(自然科学版);2005年04期
12 陈笑蓉;秦进;;基于最大熵原理的汉语词义消歧[J];计算机科学;2005年05期
13 曲维光;陈小荷;董宇;穗志方;;基于语境计算模型的汉语词义消歧(英文)[J];广西师范大学学报(自然科学版);2006年04期
14 王博;杨沐昀;李生;赵铁军;;中文全词消歧在机器翻译系统中的性能评测[J];自动化学报;2008年05期
15 李辉;张琦;卢湖川;杨德礼;;基于知网的中文常问问答系统[J];计算机工程;2008年23期
16 刘商飞;张志祥;;基于改进的Bayes判别法的中文多义词消歧[J];计算机与数字工程;2009年10期
17 王瑞琴;孔繁胜;潘俊;;基于WordNet的无导词义消歧方法[J];浙江大学学报(工学版);2010年04期
18 金澎;;词义消歧和词义消歧评测简介[J];术语标准化与信息技术;2010年03期
19 张仰森;郭江;;四种统计词义消歧模型的分析与比较[J];北京信息科技大学学报(自然科学版);2011年02期
20 全昌勤;何婷婷;姬东鸿;余绍文;;基于多分类器决策的词义消歧方法[J];计算机研究与发展;2006年05期
中国重要会议论文全文数据库 前10条
1 吴崇斌;张全;;上下文边界可变的贝叶斯分类器词义消歧方法[A];第五届全国青年计算语言学研讨会论文集[C];2010年
2 张仰森;黄改娟;苏文杰;;基于隐最大熵原理的汉语词义消歧方法[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
3 张云涛;龚玲;王永成;;基于语料库的朴素贝叶斯方法的词义消歧[A];2005年中国智能自动化会议论文集[C];2005年
4 余晓峰;刘鹏远;赵铁军;;一种基于《知网》的汉语词语词义消歧方法[A];第二届全国学生计算语言学研讨会论文集[C];2004年
5 丁江伟;刘挺;卢志茂;李生;;隐马尔可夫模型和贝叶斯模型词义消歧对比研究[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
6 吴云芳;温珍珊;段慧明;俞士汶;;语料库粗粒度词义标注[A];第六届汉语词汇语义学研讨会论文集[C];2005年
7 何径舟;王厚峰;;基于特征自动选取的汉语词义消歧[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
8 秦颖;王小捷;;组合中文词义消歧[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
9 于丽丽;丁德鑫;曲维光;陈小荷;石民;;基于多分类器集成的古代汉语词义消歧[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
10 王菁华;刘建毅;王枞;;语义网络结构下的词义消歧[A];2006年首届ICT大会信息、知识、智能及其转换理论第一次高峰论坛会议论文集[C];2006年
中国博士学位论文全文数据库 前10条
1 车超;知识自动获取的词义消歧方法[D];大连理工大学;2010年
2 涂锟;基于自然语言与记忆再重构的常识推理模型[D];华南理工大学;2010年
3 段建勇;多词表达抽取及其应用[D];上海交通大学;2007年
4 王菁华;文本中知识的获取[D];北京邮电大学;2008年
5 秦颖;汉语词和短语的歧义消解研究[D];北京邮电大学;2008年
6 冯敏萱;论汉英平行语料的平行处理[D];南京师范大学;2006年
7 王瑞琴;基于语义处理技术的信息检索模型研究[D];浙江大学;2009年
8 刘凯鹏;社会性标注关键技术及其在信息检索中的应用研究[D];哈尔滨工业大学;2010年
9 任飞亮;高适应性基于实例的机器翻译中关键技术研究[D];东北大学;2008年
10 朱朝勇;基于本体的知识库分类研究[D];中国科学技术大学;2013年
中国硕士学位论文全文数据库 前10条
1 栾博;基于句法树的中文词义消歧方法研究[D];哈尔滨理工大学;2014年
2 史俊冰;问答系统中词义消歧与关键词扩展研究[D];太原理工大学;2011年
3 李小贻;基于语义概念的词义消歧方法[D];华中师范大学;2013年
4 詹靓雯;基于知网的中文词义消歧研究[D];中国计量学院;2012年
5 魏晓亮;概念与属性约束知识抽取及其应用研究[D];北方工业大学;2013年
6 邓宾;中文词义消岐研究[D];昆明理工大学;2009年
7 万海旭;基于WordNet的词义消歧研究[D];吉林大学;2013年
8 陈浩;基于二阶上下文的无导词义消歧研究[D];华中师范大学;2005年
9 赵文静;基于维基百科的微博文本语义概念扩展研究[D];西安电子科技大学;2013年
10 秦少康;英语词汇歧义及英汉机器翻译中词义消歧上下限研究[D];厦门大学;2006年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978