收藏本站
《西南交通大学》 2004年
收藏 | 手机打开
二维码
手机客户端打开本文

关于计算机理解自然查询语言的研究

郑逢斌  
【摘要】:自然语言理解现在已成为人工智能研究中最活跃的领域之一。在自然语言处理的研究中,最有希望的应用领域之一是自然语言接口。计算机对自然语言中的查询语言理解的正确程度是自然语言接口质量好坏的关键。本文基于建立通用模型的概念,设计了一个通用的数据库自然语言接口系统模型,深入地研究了实现该模型的原理,同时建立了一个具体的实现系统,并希望该系统很容易地移植到其他应用领域。本文研究的内容是设计和实现一个实用的数据库自然语言接口系统的全过程的理论和策略,主要有如下几个方面的研究成果: 1、构造了一个程序设计与知识库相分离的通用的数据库自然语言接口系统模型。该模型是把汉语自然查询语言的计算机理解与知识库分开各自独立进行设计。理解部分分为词法分析、句法分析与语义分析、自然语言转中间语言、中间语言转计算机语言、应答生成等几个相对独立的模块。这种模型设计使系统抛开具体应用领域而独立设计,便于系统的移植和扩充。 2、提出了把知识库从一般到特殊划分为自然语言理解通用知识库、汉语查询句理解知识库和应用领域专用知识库三个层面,并给出了每一个层面里面应具备哪些知识库和这些知识库的结构。 3、设计并编程实现了一个通用的汉语自然语言词语切分和词性标注软件系统,该子系统混合使用统计信息和语法规则。重点研究了切分歧义的发现和消除、人名的识别等几个部分,提出了首先用基于词典的最大匹配法匹配出最长词和次长词,然后检测是否存在切分歧义,其次判断出切分歧义类型,最后根据切分歧义类型的不同分别进行切分歧义的消除等一套有效方法。本子系统可以加载用户分词词典,并且用户词典的级别高于通用词典,不作任何修改可以用于各个专业领域的句子词语切分。 4、构造了一套即适合查询语言语义表示又利于转换计算机执行语句的中间语言,并给出了自然语言转中间语言的具体转换算法。该中间语言由查询成分链表querylink、复合概念等价变换链表conceptlink、实体队列entityqueue、查询目标链表queryaimlink、查询条件树queryconditiontree等构成。 第n页 西南交通大学博士研究生学位论文 5、对汉语查询句的外部特征和内部语义进行了详细地研究,给出了汉语 查询句语义模板的分类,并研究出在计算机上能实现的汉语查询句从形式到语 义的分类算法。同时识别和理解的查询语言覆盖面从过去人们只研究祈使句和 特殊疑问句扩展到是非问句、选择问句和正反问句等句型。在句法分析中研究 了查询句的指代消解和省略补充规律并设计了软件实现算法。 6、通过对汉语查询句查询目标的研究,将查询目标概念分解为直接查询 目标、逻辑推理目标和比较判断目标三个阶段,研究了这三个阶段的关系,并 构造了一套它们递进转换的算法。通过对汉语查询句各种各样查询条件的研究 得出查询条件表达式可以形式化表示为二叉树的结论,并构造了查询条件字符 块转换为二叉树的一套算法,进而转换为SQL语句的wHERE子句。 7、建立并研究了复合概念、逻辑概念与标准概念的内在联系,构造了复 合概念分解算法和合成算法、逻辑概念的推理算法。 本文研究工作正在进行软件实现。
【关键词】:人工智能 自然语言处理 人机接口 中间语言 查询目标 查询条件
【学位授予单位】:西南交通大学
【学位级别】:博士
【学位授予年份】:2004
【分类号】:TP301
【目录】:
  • 中文摘要5-7
  • 英文摘要7-13
  • 第1章 绪论13-20
  • 1.1 论文的目的和意义14-15
  • 1.2 国内外研究情况和发展趋势15-18
  • 1.2.1 国外的研究情况15-17
  • 1.2.2 国内的研究情况17
  • 1.2.3 存在的主要问题17-18
  • 1.3 本文的研究工作18-20
  • 第2章 数据库汉语通用接口模型及其知识库的构造20-38
  • 2.1 数据库汉语通用接口模型的体系结构20-23
  • 2.1.1 实现数据库自然语言接口的的可行性20
  • 2.1.2 数据库汉语通用接口模型的体系结构20-23
  • 2.2 一般知识的概念和知识表示方法23-24
  • 2.3 汉语自然语言理解通用知识库24-28
  • 2.4 理解汉语查询语句通用知识库28-32
  • 2.5 应用领域专用知识库32-36
  • 2.6 应用领域知识获取和维护子系统36-38
  • 第3章 词语切分与词性标注软件系统的研究38-60
  • 3.1 汉语自动分词的一般方法38-40
  • 3.2 SWJTU汉语自动分词系统的总体模块结构40-43
  • 3.3 歧义切分类型的识别与处理技术43-49
  • 3.3.1 歧义字段的类型及识别方法43-46
  • 3.3.2 交集型歧义字段的处理算法46-47
  • 3.3.3 组合型歧义字段的处理技术47-49
  • 3.4 中文姓名的自动识别技术49-52
  • 3.5 汉语词性自动标注技术52-56
  • 3.5.1 CLAWS算法与VOLSUNGA算法简介53-54
  • 3.5.2 基于规则和统计相结合的词性标注方法54-56
  • 3.6 SWJTU分词系统输出形式和实验结果56-60
  • 第4章 查询句语义自动分析与中间语言生成的研究60-106
  • 4.1 汉语查询句语义结构形式与计算机理解流程61-64
  • 4.1.1 汉语查询句语义结构形式61-62
  • 4.1.2 自然语言中逻辑词62-63
  • 4.1.3 计算机理解自然查询语言的实现流程63-64
  • 4.2 本系统中间表示语言的结构64-72
  • 4.3 查询成分链表信息完备的有关算法72-80
  • 4.4 概念等价变换与查询实体确立算法80-85
  • 4.5 查询目标分析及其中间语言表示85-95
  • 4.5.1 查询目标分类85-87
  • 4.5.2 查询目标关系图87-89
  • 4.5.3 汉语查询句语义模板句型分类算法89-91
  • 4.5.4 查询目标识别及转换中间语言表示的算法91-95
  • 4.6 查询条件分析及其中间语言表示过程95-102
  • 4.6.1 查询条件分类95-97
  • 4.6.2 查询条件块的识别算法97-99
  • 4.6.3 查询条件中间语言树生成算法99-102
  • 4.7 系统中产生式逻辑推理算法102-106
  • 第5章 产生程序语句及应答生成的研究106-120
  • 5.1 SQL查询语言分析106-110
  • 5.2 直接查询目标和查询条件转换到SQL语句的算法110-114
  • 5.3 SQL执行结果到回答用户目标的转换过程114-116
  • 5.4 应答智能生成子系统的研究116-120
  • 总结与展望120-123
  • 致谢123-124
  • 参考文献124-133
  • 附录1 汉语词类共现矩阵统计数据表133-135
  • 附录2 自然查询语句句型特征参数知识库sentb135-136
  • 附录3 自然查询语句语义模板特征参数semab样例136-137
  • 附录4 查询目标知识库aimb样例137-138
  • 附录5 条件知识库condb样例138
  • 附录6 查询句标准概念知识库stanb1样例138-139
  • 攻读博士学位期间的论文及科研成果139-140

【相似文献】
中国期刊全文数据库 前10条
1 黄楠;;模糊关系数据库查询的探究[J];信息与电脑(理论版);2011年06期
2 陈荣鑫;;基于函数式中间语言的XML查询并行化[J];重庆理工大学学报(自然科学);2011年07期
3 华艳;;大型数据库设计方法的研究[J];电脑知识与技术;2011年26期
4 付林;;查询程序在设备确认记录中的应用[J];川化;2011年03期
5 杨振宇;;巧用SQL的查询技术[J];软件;2011年04期
6 王前厚;王炳辉;;锅炉自动抄表系统实现——一种用WinCC实现自定义报表的方法[J];自动化博览;2011年08期
7 史文津;;小型数据库ACCESS在高校学籍管理中的应用[J];科技广场;2011年05期
8 杨雪松;冉婕;;基于WEB的法院判例检索系统研究[J];电脑知识与技术;2011年14期
9 陈燕;;浅谈如何提高基于WEB的软件系统的查询速度[J];现代营销(学苑版);2011年07期
10 颜晶晶;;带约束本体语义扩展的信息过滤算法[J];计算机应用;2011年07期
中国重要会议论文全文数据库 前10条
1 熊文新;;提升自然语言向中间语言转换准确性的增强处理[A];第二届全国学生计算语言学研讨会论文集[C];2004年
2 樊昱;高红雨;廖湖声;;基于Java的ArcSDE空间数据查询的设计与实现[A];Java技术及应用的进展——第七届中国Java技术及应用交流大会文集[C];2004年
3 周香凝;;一种支持快速查询的敏感数据加密机制[A];计算机技术与应用进展——全国第17届计算机科学与技术应用(CACIS)学术会议论文集(下册)[C];2006年
4 杨晓峰;李堂秋;洪青阳;;汉英机器翻译系统中的一种词义排歧方法[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
5 郑凯锋;唐继舜;;实用专家系统和数据库系统若干智能行为的技术研究[A];土木工程计算机应用文集——中国土木工程学会计算机应用学会第五届年会论文集[C];1993年
6 张朝阳;宁洪;王挺;郭超;;多数据库系统查询计划优化研究[A];2009年研究生学术交流会通信与信息技术论文集[C];2009年
7 杜礼新;陈子阳;;传感器网络中的嵌套查询[A];2005年全国理论计算机科学学术年会论文集[C];2005年
8 朱琦;;信息安全-应用程序代码保护[A];2008年MIS/S&A学术交流会议论文集[C];2008年
9 张霄军;;“长安”的同名地名自动识别与指代消解[A];陕西省社会科学界第二届(2008)学术年会——青年博士论坛“陕西新起点:创新·发展·民生”专题获奖论文选编[C];2008年
10 谢春华;;ERP信息查询系统设计[A];冶金自动化信息网年会论文集[C];2004年
中国重要报纸全文数据库 前10条
1 福建 忠英;手机翻译时代的到来[N];电脑报;2004年
2 ;手续网上办:少跑路,少受气![N];中国计算机报;2006年
3 南京邮电学院 李建忠;“Hello,World!”程序[N];计算机世界;2002年
4 陈俊杰;网上订报跟我来[N];电脑报;2003年
5 ;答疑解惑[N];中国质量报;2002年
6 南京邮电学院 李建忠;Microsoft.NET平台[N];计算机世界;2002年
7 骆卫华 刘群 张俊林;搜索引擎:性能提高遇到瓶颈[N];计算机世界;2006年
8 心随;用UC2005玩同学录[N];电脑报;2004年
9 黄穗诚;广州房管局公开征求意见[N];广东建设报;2007年
10 荆延宁;中心局作业系统给据散件的处理[N];中国邮政报;2008年
中国博士学位论文全文数据库 前10条
1 郑逢斌;关于计算机理解自然查询语言的研究[D];西南交通大学;2004年
2 陈凯明;逆编译中几项关键技术研究[D];合肥工业大学;2004年
3 齐璇;汉语语义知识的表示及其在汉英机译中的应用[D];国防科学技术大学;2002年
4 马红妹;汉英机器翻译中汉语上下文语境的表示与应用研究[D];中国人民解放军国防科学技术大学;2002年
5 冯仕红;基于设计特征和参数化的工程化界面设计模式研究[D];山东大学;2008年
6 张毅波;史文结构化信息检索系统的研究与实现[D];中国科学院研究生院(软件研究所);2001年
7 方淼;语义单元自动获取研究[D];大连理工大学;2008年
8 任坤;DSP编译器关键技术研究[D];浙江大学;2007年
9 孟祥福;Web数据库柔性查询关键技术研究[D];东北大学;2010年
10 史建琦;面向目标代码的实时操作系统形式化验证方法研究[D];华东师范大学;2012年
中国硕士学位论文全文数据库 前10条
1 黄海;基于IDA的代码解析与中间语言翻译[D];解放军信息工程大学;2009年
2 蒋晓科;中文数据库自然语言查询技术研究[D];暨南大学;2008年
3 张荣荣;面向领域的数据库问答系统关键技术研究[D];山东科技大学;2011年
4 潘奇峰;数据库自然语言接口研究及其在审计中的应用[D];哈尔滨工程大学;2008年
5 胡晓军;基于自然汉语的数据库查询研究[D];电子科技大学;2006年
6 黄大科;分布式异构数据源查询与优化[D];清华大学;2004年
7 张占英;关于数据库汉语查询语句中查询信息的研究[D];河南大学;2004年
8 洪青阳;汉英机器翻译英文生成模块XMGEN的设计与实现[D];厦门大学;2001年
9 包苏鲁德;多语种机器翻译平台关键技术研究[D];复旦大学;2008年
10 韩冬;基于虚拟寄存器的中间语言[D];西南交通大学;2009年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026