收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于场景化知识表示的自然语言处理及其在自动文本校对中的应用

王燚  
【摘要】:自然语言处理就是用计算机处理自然语言,以理解自然语言中表达的知识和含义,或者将知识用自然语言表达出来。因而综合知识表示的自然语言模型是自然语言处理研究的一个核心问题。然而目前尚缺乏一种从知识的语言表达的角度而设计的自然语言模型。本文从分析人使用语言表达知识的自然过程出发,提出了一种知识语言表达的总体模型,并据此提出了场景化知识表示体系。同时,将该语言模型和知识表示体系应用于基于语义的特殊领域文本校对中,取得了良好的效果。 我们认为,人使用自然语言表达其认知的一个核心步骤是提取认知中的关键信息。这些关键信息同样也是人进行逻辑思考的基础。我们分析了自然语言表达知识时所需要的各类关键信息,并采用场景的形式来组织这些信息,从而形成了场景化知识表示的结构。从知识中提取出关键信息被称为知识的场景化分析。它主要包括三个步骤,即:组成识别、特征识别和场景识别。它们分别提取出知识的组成信息、知识的组成元素的特征信息以及它们在特定场景中的角色信息。 在此基础上,我们研究了基于知识场景结构的形式化推理方法,包括:继承推理、例证推理和否定推理。同时也定义了将场景知识结构转换为一阶谓词逻辑表达式的转换规则,为使用自动推理的方法进行语义判断提供了基础。 以知识的场景化描述为核心,提出了使用语言描述知识的的总体模型。在该模型中,知识的语言描述共包括五种主要的方式:名称描述、指代描述、主类描述、内在结构描述和相关知识描述。其中前三种描述方式统称为词汇化描述,因为它们均直接使用词汇来表达知识。后两种统称为结构化描述。其中,内在结构描述通过对知识的场景化分析,将知识的场景结构通过语言转换模板转换为语言的序列结构。这种描述方式主要产生语言中的句子结构。相关知识描述则使用知识的相关知识对它进行描述。其方式和过程与内在结构描述相同。它主要产生语言中的短语、定语从句、插入语等结构。 在这一模型的基础上,我们还分析了汉语中的各种句型和短语结构,提出了相应的语法场景模板和语言转换模板。通过这些模板,可以实现知识的场景化表示与自然语言之间的双向转换,从而使场景化知识表示成为一种真


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 詹卫东;;自然语言的自动分析与生成简介[J];术语标准化与信息技术;2010年04期
2 闫琪,张志伟,宁洪;用户搜索请求中限定成分的识别及提取[J];计算机工程与科学;2000年03期
3 左远清,周洞汝,王波;自然语言处理在搜索引擎信息检索中的应用[J];现代计算机;2002年07期
4 刘亚军,徐易,高莉莎;提高IQAS查询速度的一种方法[J];计算机工程与应用;2004年11期
5 杜波,田怀凤,王立,陆汝占;基于多策略的专业领域术语抽取器的设计[J];计算机工程;2005年14期
6 傅立云;刘新;;基于词典的汉语自动分词算法的改进[J];情报杂志;2006年01期
7 卢志茂;刘挺;李生;;统计词义消歧的研究进展[J];电子学报;2006年02期
8 贾君枝;邰杨芳;;FrameNet的语义类型研究[J];情报理论与实践;2007年05期
9 张莉;刘雅举;李东明;侯晨伟;;中文问句分类系统的分析[J];科技情报开发与经济;2007年25期
10 程彩虹;王惠临;解国栋;;基于潜在语义分析的自动词法学习技术[J];情报理论与实践;2008年05期
11 李波;邱锡鹏;曹均阔;;查询扩展在开放领域问答系统中的应用[J];计算机应用与软件;2009年07期
12 马连刚;夏克俭;;中医方剂与图集的转换的设计与实现[J];网络安全技术与应用;2010年02期
13 仲夏;张志平;王惠临;;词汇化树邻接语法研究述评及中文应用初探[J];现代图书情报技术;2010年05期
14 麦范金;岳晓光;赵子强;路英;王挺;岳砥柱;;基于自然语言处理的智能评分系统[J];桂林理工大学学报;2010年03期
15 朱译翔;;中文名词性谓词的语义角色标注的研究[J];福建电脑;2010年09期
16 刘一宁;;学术定义抽取研究综述[J];情报探索;2011年08期
17 邵品洪;自然语言处理在情报检索中的应用[J];现代图书情报技术;1994年03期
18 吕西安·马尔柰夫,保尔·若利昂;简论自然语言处理的连接网络法[J];中文信息学报;1997年02期
19 张琳琳,宋继平,王能忠;基于核心推导的句法分析[J];西南师范大学学报(自然科学版);1997年03期
20 雷鸣,刘建国,王建勇,陈葆珏;一种基于词典的搜索引擎系统动态更新模型[J];计算机研究与发展;2000年10期
中国重要会议论文全文数据库 前10条
1 支流;段慧明;朱学锋;俞士汶;;中文缩略语知识库建设[A];第三届学生计算语言学研讨会论文集[C];2006年
2 白刚;张铮;丁宗尧;朱毅;;中文文本聚类在互联网搜索的研究与应用[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
3 刘群;张浩;白硕;;中文信息处理开放平台的设计[A];第一届学生计算语言学研讨会论文集[C];2002年
4 支流;朱学锋;段慧明;俞士汶;;中文缩略语还原技术初探[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
5 刘开瑛;由丽萍;;汉语框架语义知识库构建工程[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
6 郑家恒;谭红叶;王兴义;;基于模式匹配的中文专有名词识别[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年
7 葛诗利;陈潇潇;;中国EFL学习者自动作文评分探索[A];第三届学生计算语言学研讨会论文集[C];2006年
8 宋柔;;自然语言处理中语言知识的基础性地位[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年
9 杨丽鹏;林世平;;基于关联规则和自然语言处理技术的概念间非分类关系的抽取[A];2008通信理论与技术新进展——第十三届全国青年通信学术会议论文集(上)[C];2008年
10 孙玉芳;;中文信息处理与国家信息化建设[A];面向21世纪的科技进步与社会经济发展(上册)[C];1999年
中国博士学位论文全文数据库 前10条
1 王燚;基于场景化知识表示的自然语言处理及其在自动文本校对中的应用[D];西南交通大学;2005年
2 卢延鑫;基于自然语言处理技术的循证医学信息提取研究[D];复旦大学;2011年
3 李良炎;基于词联接的自然语言处理技术及其应用研究[D];重庆大学;2004年
4 代印唐;基于语义网络的知识协作关键技术研究[D];复旦大学;2009年
5 王立欣;翻译标准自动量化方法研究[D];上海外国语大学;2007年
6 李莎莎;面向搜索引擎的自然语言处理关键技术研究[D];国防科学技术大学;2011年
7 周雅倩;最大熵方法及其在自然语言处理中的应用[D];复旦大学;2005年
8 易勇;计算机辅助诗词创作中的风格辨析及联语应对研究[D];重庆大学;2005年
9 谢学敏;基于动态流通语料库(DCC)的流行语释义信息自动提取研究[D];北京语言大学;2006年
10 屈刚;英汉双语短语对齐[D];上海交通大学;2007年
中国硕士学位论文全文数据库 前10条
1 全昌勤;基于语料库的汉语词义消歧方法研究[D];华中师范大学;2005年
2 张峰;基于自然语言处理的自动文摘系统[D];电子科技大学;2006年
3 丁卓冶;中文命名实体识别的研究[D];大连理工大学;2008年
4 孙继明;基于知网的汉语词义消歧研究[D];国防科学技术大学;2007年
5 孙广庆;基于语义范畴扩展的词义消歧的研究[D];哈尔滨工程大学;2008年
6 侯丽敏;基于网络的智能答疑系统的研究与实现[D];河南大学;2005年
7 崔昌利;俄语简单句述谓VP的模式化及自动识别[D];黑龙江大学;2005年
8 赵城利;基于Web的信息智能感知技术及应用[D];国防科学技术大学;2004年
9 张学;EBMT系统中翻译模板的抽取与匹配[D];大连理工大学;2006年
10 巩晓婷;基于文本的信息隐藏技术研究[D];福州大学;2006年
中国重要报纸全文数据库 前10条
1 本报记者 姜靖;张全:给网络装上“电子眼”[N];科技日报;2009年
2 本报记者 祝蕾 见习记者 许凯;李晓戈:努力缩小国内外数字“鸿沟”[N];济南日报;2010年
3 金利;东北大学自然语言处理实验室形成特色[N];科技日报;2007年
4 小柯;张全:网络环境“清洁师”[N];广东科技报;2009年
5 何清 史忠植 王伟;搜索引擎的前沿技术[N];计算机世界;2006年
6 沈建缘;洪小文:时尚科学家[N];经济观察报;2009年
7 记者 刘传书;微软在深圳设实验室[N];科技日报;2006年
8 郑昊;数据挖掘加工海量数据[N];中国计算机报;2007年
9 ;开天辟地第一回[N];计算机世界;2002年
10 刘洁;SAS分析产品链增添“新成员”[N];科技日报;2008年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978