收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于认知的文本语境生成和度量研究

方宁  
【摘要】: 认知语言学指出语境就是为理解说话者真正的意图所依靠的上下文,环境、整体情景以及交谈人之间的关系。文本语境简单的说就是文本的上下文,理解句子必须结合局部上下文和全局上下文两个方面。目前许多证据显示人类是用语义联系和上下文的帮助来分析与理解文本的。然而,目前机器分析文本所采用的模型往往忽略语境对文本理解的影响,其原因在于文本语境的生成是一个复杂的心理过程;而度量文本语境在文本理解中的作用又与认知过程的主观感受密切相关。目前,机器生成的高质量的文本语境需要手工参与(如OWL),而自动生成的文本语境会丢失太多的信息(如VSM),且机器无法对文本语境的认知感受进行度量。为了让机器能够自动生成文本语境,并拟人化地定量分析文本认知过程中文本语境的复杂度和信息量,本文基于认知经济原则、人类概念学习的复杂度、以及最大关联理论,对文本语境的生成和度量展开研究。 1.本文分别讨论了局部、全局和领域文本语境的生成:1)利用模糊认知图来实现局部文本语境的生成;2)利用局部文本语境的叠加特性来生成全局文本语境;3)通过局部文本语境的约简来生成领域文本语境。该研究可较好地解决文本语境生成的多层次、多粒度的问题。 2.在多层次文本语境的生成过程中:1)本文提出的文本语境生成方法具有直观性、可叠加性和可分解性,因此符合文本理解过程中语境的动态演化特性;2)提出局部文本语境对全局文本语境贡献的计算方法,从而可有效地在文本语境的生成过程中获取与存储全局和局部语境之间的语义关系;3)基于统计学的方法对领域文本语境生成的有效性进行评价,使机器生成的领域文本语境能合理而有效地表达该领域内的知识。 3.基于认知经济原则中能量和信息量的关系,提出文本语境的度量应该从复杂度和信息量两个方面展开研究:1)基于人类概念学习的复杂度,提出度量文本语境的复杂度的方法,从而可使机器方便地计算文本语境在文本认知过程中的作用;2)基于认知语言学中的最大关联理论,提出文本语境信息量的度量方法,从而可使机器对文本认知的主观感受进行定量的度量。 4.为验证文本语境复杂度和信息量度量的正确性,采用了语言学和认知科学的观点:1)验证实验用定量计算代替传统的定性分析,因此可为基于机器的文本分析和理解提供认知科学的理论和方法;2)通过计算文本语境的复杂度和信息量来模拟人的文本阅读过程,度量人的文本阅读体验,从而一定程度上为机器实现了一种拟人化的文本分析方法。 5.由于寻找最大文本语境信息量的句子队列是NP难的组合优化问题,而信息量的计算复杂度是O(n~2),文本语境的复杂度计算更是NP难的问题。所以,本文从三个方面对文本语境的度量进行了优化和简化:1)通过遗传算法解决了文本语境信息量度量中寻找最佳句子排列的优化问题;2)提出最大文本语境信息量的近似计算方法,文本语境信息量的计算复杂度从( )O n 2降低到O ( n );3)分析了文本语境信息量和复杂度之间的关系,为在实际问题中的选取合理的度量方法提供依据。 本文的文本语境生成方法能获取多个层次的文本语境,并从认知科学的角度对文本语境的复杂度和信息量进行度量。本文的研究可以为文本语境的生成和度量提供新的方法与思路;通过结合传统语义分析方法和认知科学的原理为基于机器的文本理解提供理论支持,同时可为大规模网络环境的应用提供技术支持,从而可为Internet的广告推送、e-Business的商品推荐、网络问答系统的构建、e-Science中的知识服务、以及网络文本片段的自组织和Web智能浏览提供一种新的方法。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 化柏林;;国内外知识抽取研究进展综述[J];情报杂志;2008年02期
2 邱莉榕;翁彧;赵小兵;;藏文语义本体中的上下位关系模式匹配算法[J];中文信息学报;2011年04期
3 全昌勤,何婷婷,姬东鸿,刘辉;从搭配知识获取最优种子的词义消歧方法[J];中文信息学报;2005年01期
4 鲁松;孙红梅;白硕;;基于类别词语权重的MBL改进方法[J];模式识别与人工智能;2001年01期
5 贾秀玲;文敦伟;;面向文本的本体学习研究概述[J];计算机科学;2007年02期
6 李大玲;;知识技术的发展对知识工程的影响[J];图书情报工作;2006年04期
7 陈敏杰;;问答系统中问题分析模块的实现[J];经营管理者;2009年13期
8 詹卫东;;自然语言的自动分析与生成简介[J];术语标准化与信息技术;2010年04期
9 杨忠祥;;自然语言的学习与知识获取问题[J];计算机研究与发展;1989年01期
10 王宗军;一种增强型智能决策支持系统的结构设计[J];计算机工程与设计;1994年04期
11 王国胤,施鸿宝,王栩;用前向神经网络获取特定结构的规则知识[J];西安交通大学学报;1996年01期
12 陆志峰,赵杰雄;知识获取系统TPKA的研究[J];暨南大学学报(自然科学与医学版);1996年03期
13 王继成;一个基于符号神经网络的知识获取系统[J];电子学报;1998年08期
14 陈森昌,刘建华,黄树槐;挖掘专家知识[J];华中理工大学学报;1999年01期
15 闵联营;知识获取技术探析[J];交通与计算机;1999年05期
16 闫琪,张志伟,宁洪;用户搜索请求中限定成分的识别及提取[J];计算机工程与科学;2000年03期
17 刘斌,赵卫东,何建敏;知识获取的粗分析方法[J];计算机工程与应用;2001年17期
18 左远清,周洞汝,王波;自然语言处理在搜索引擎信息检索中的应用[J];现代计算机;2002年07期
19 钱揖丽,郑家恒;文本切分知识获取及其应用[J];计算机工程与应用;2003年02期
20 刘亚军,徐易,高莉莎;提高IQAS查询速度的一种方法[J];计算机工程与应用;2004年11期
中国重要会议论文全文数据库 前10条
1 许勇;宋柔;;基于百科词典的知识获取系统的研究与实现[A];第一届学生计算语言学研讨会论文集[C];2002年
2 张树武;徐波;黄泰翼;;汉语大词汇/连续语音识别语言建模技术分析[A];第四届全国人机语音通讯学术会议论文集[C];1996年
3 许春义;魏艳红;刘爱国;;新型焊接工艺设计专家系统[A];第十次全国焊接会议论文集(第2册)[C];2001年
4 王重鸣;陆兴海;王世潮;王叶毅;;决策知识结构获取与表征的多方法分析[A];全国第七届心理学学术会议文摘选集[C];1993年
5 李盛;杨尔弘;;一种基于聚类的汉语词语知识的获取方法[A];第一届学生计算语言学研讨会论文集[C];2002年
6 蒋文科;杨云森;许文华;邝朴生;;基于模糊神经网络的知识获取系统[A];1995年中国智能自动化学术会议暨智能自动化专业委员会成立大会论文集(下册)[C];1995年
7 马建军;陈文伟;;IDSS中知识获取的一种新方法[A];1996中国控制与决策学术年会论文集[C];1996年
8 翟忠平;王坚;凌卫青;;企业模型诊断系统(IEM-D)的规则知识获取[A];先进制造技术论坛暨第二届制造业自动化与信息化技术交流会论文集[C];2003年
9 支流;段慧明;朱学锋;俞士汶;;中文缩略语知识库建设[A];第三届学生计算语言学研讨会论文集[C];2006年
10 张辉;钱宗才;屈景辉;刘敬华;;基于粗糙集理论的知识获取研究及应用[A];全面建设小康社会:中国科技工作者的历史责任——中国科协2003年学术年会论文集(上)[C];2003年
中国博士学位论文全文数据库 前10条
1 方宁;基于认知的文本语境生成和度量研究[D];上海大学;2009年
2 卢延鑫;基于自然语言处理技术的循证医学信息提取研究[D];复旦大学;2011年
3 生佳根;基于本体的知识获取、管理和应用方法研究[D];南京航空航天大学;2012年
4 李良炎;基于词联接的自然语言处理技术及其应用研究[D];重庆大学;2004年
5 代印唐;基于语义网络的知识协作关键技术研究[D];复旦大学;2009年
6 郝宇;基于Kolmogorov复杂性的知识获取方法研究[D];清华大学;2005年
7 王立欣;翻译标准自动量化方法研究[D];上海外国语大学;2007年
8 李莎莎;面向搜索引擎的自然语言处理关键技术研究[D];国防科学技术大学;2011年
9 康向平;基于形式概念分析理论的知识获取模型研究[D];山西大学;2012年
10 郭永洪;基于本体的鱼病知识获取与诊断推理集成系统研究[D];中国农业大学;2004年
中国硕士学位论文全文数据库 前10条
1 张涛;中文文本中未知词语的词义知识获取[D];山西大学;2005年
2 黄际洲;聊天机器人知识库自动抽取算法的研究与实现[D];重庆大学;2006年
3 王海燕;基于中小企业产业网络的知识创新研究[D];广东外语外贸大学;2008年
4 全昌勤;基于语料库的汉语词义消歧方法研究[D];华中师范大学;2005年
5 张峰;基于自然语言处理的自动文摘系统[D];电子科技大学;2006年
6 马雪;基于本体的隐性知识管理系统研究[D];西北大学;2008年
7 丁卓冶;中文命名实体识别的研究[D];大连理工大学;2008年
8 孙继明;基于知网的汉语词义消歧研究[D];国防科学技术大学;2007年
9 孙广庆;基于语义范畴扩展的词义消歧的研究[D];哈尔滨工程大学;2008年
10 韩冠宇;智能化机械传动装置CAD系统[D];北京工业大学;2001年
中国重要报纸全文数据库 前10条
1 本报记者 姜靖;张全:给网络装上“电子眼”[N];科技日报;2009年
2 本报记者 祝蕾 见习记者 许凯;李晓戈:努力缩小国内外数字“鸿沟”[N];济南日报;2010年
3 金利;东北大学自然语言处理实验室形成特色[N];科技日报;2007年
4 小柯;张全:网络环境“清洁师”[N];广东科技报;2009年
5 何清 史忠植 王伟;搜索引擎的前沿技术[N];计算机世界;2006年
6 贺俊;汇聚亿万草根智慧 奇虎发布经验搜索[N];证券日报;2006年
7 记者  章迪思;区域创新能力 上海重回榜首[N];解放日报;2006年
8 记者  冯娟;创新:冠军有“短腿”[N];上海金融报;2006年
9 沈建缘;洪小文:时尚科学家[N];经济观察报;2009年
10 王春 程蓉 龚黎明;上海综合创新能力缘何全国领先[N];科技日报;2006年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978