收藏本站
《安徽大学》 2006年
收藏 | 手机打开
二维码
手机客户端打开本文

基于双向搜索的ILP算法构建汉语语义自动切分系统

许中卫  
【摘要】:自然语言理解主要有两种途径。一种是利用各种语言规则对自然语句进行分析,得到句中各组成成分间的关系结构。另一种是基于数据分析方法,被称为自然语言理解中的“经验主义”,或称实证方法,它主要是利用大规模的语料库,采用概率的方法得到各语言现象共存的概率,在分析新语料时以共存概率的大小来确定语言成分之间的关系。基于规则的理性方法,本质是一种确定性的演绎推理方法。其优点在于根据上下文对确定事件的定性描述,能够充分利用现有的语言学成果。缺点是对一些不确定的事件则无能为力,同时规则的相容性和适应性也存在着限制。基于统计的方法是一种经验主义的方法,其优势在于它的全部知识都是通过对大规模的语料库加工分析而得到的,可以获得很好的一致性和覆盖性。基于统计的方法是一种非确定性的定量分析方法,这种定量分析是基于概率的,因此必然会掩盖小概率事件的发生。本文考察一种新的实证途径,采用结构化的知识表示,应用ILP方法解决自然语言语句切分分析器的获取问题。 自然语言语义结构的分析是自然语言理解的基础,可分为二个层次,其一是研究能充分表达自然语句内各成份间语义关系的表示方法;其二是研究如何将自然语句转换成某种期望的语义表示形式,即在自然语言语句和其对应的语义表示间建立正确的映射,完成这种映射也称为自然语言语句的语义切分分析,这也是本文研究的重点之一,本文给出了一种基于ILP算法的自动语义切分器的构建系统ICASP,并通过一个切分示例来说明ICASP构建的切分器将自然语句映射成论旨角色语义表示的方法途径。论旨角色语义分析的基本思想是:在句中起中心作用的动词,同参与动作的各个成分个体一起构成句子的“语义格”框架,以此描述自然语句中各组成成分间的深层语义关系,表达施事(谁做的)、受事(对谁做的)、工具(用什么工具)等概念所表示的语法语义关系。 “切分”一词常用来表达将句子转换成能够明确描述句子语法关系的一种层次结构,依据某一上下文无关文法,自然语句可能可被切分为由句子成分加入适当的标注组成的层次结构,然而局限在语法结构上的切分只是自然语言语句理解
【学位授予单位】:安徽大学
【学位级别】:博士
【学位授予年份】:2006
【分类号】:TP391.1

【参考文献】
中国期刊全文数据库 前10条
1 索东梅;自然语言理解研究[J];长春师范学院学报;2005年02期
2 赵丽丽,孙吉贵;归纳逻辑程序设计综述[J];吉林大学学报(信息科学版);2005年S2期
3 程琪龙;试论Fillmore格语法1971模式[J];解放军外语学院学报;1995年06期
4 杨新武,刘椿年;遗传归纳逻辑程序设计的个体编码生长现象[J];计算机研究与发展;2003年08期
5 叶风,徐晓飞,权光日,陈彬,邱深山;归纳逻辑程序设计中的优化问题研究[J];计算机研究与发展;1999年05期
6 郑磊,贾东,刘椿年;归纳逻辑程序设计综述[J];计算机工程与应用;2003年17期
7 叶风,权光日,王熙照;基于归结的最大一般理论特化[J];计算机学报;1999年12期
8 杨开城;一种基于句法语义特征的汉语句法分析器[J];中文信息学报;2000年03期
9 刘贵全,陈恩红,蔡庆生;基于归纳逻辑程序设计的学习方法及其实现的研究[J];软件学报;1997年10期
10 叶风,徐晓飞;多重极小一般普化[J];软件学报;1999年07期
中国博士学位论文全文数据库 前2条
1 齐璇;汉语语义知识的表示及其在汉英机译中的应用[D];国防科学技术大学;2002年
2 杨新武;遗传归纳逻辑程序设计技术研究[D];北京工业大学;2003年
【共引文献】
中国期刊全文数据库 前10条
1 王永梅;胡学钢;;决策树中ID3算法的研究[J];安徽大学学报(自然科学版);2011年03期
2 叶明全;;数据挖掘在医疗数据中的应用[J];安徽工程科技学院学报(自然科学版);2007年03期
3 贾泽露;;基于GIS与SDM集成的农用地定级专家系统[J];安徽农业科学;2008年14期
4 蔡丽艳;冯宪彬;丁蕊;;基于决策树的农户小额贷款信用评估模型研究[J];安徽农业科学;2011年02期
5 赵静娴;;基于决策树的食品安全评估研究[J];安徽农业科学;2011年32期
6 王斌;;基于聚类的决策树在玉米种质筛选中的应用[J];安徽农业科学;2011年33期
7 孙文新;齐名军;;人工鱼群优化在云计算环境中任务调度算法[J];安徽农业科学;2012年11期
8 江景涛;;自然语言理解的体验性及其数据化[J];安徽文学(下半月);2009年11期
9 陈文;基于决策树的入侵检测的实现[J];安徽技术师范学院学报;2005年05期
10 覃爱明,胡昌振,谭惠民;网络攻击检测中的机器学习方法综述[J];安全与环境学报;2001年01期
中国重要会议论文全文数据库 前10条
1 叶红云;倪志伟;陈恩红;;一种混合型集成学习演化决策树算法[A];2005年“数字安徽”博士科技论坛论文集[C];2005年
2 ;Learning Algorithm of Decision Tree Generation for Continuous-valued Attribute[A];第二十九届中国控制会议论文集[C];2010年
3 陈文颉;窦丽华;;基于改进遗传算法的一种新的图像恢复方法[A];第二十九届中国控制会议论文集[C];2010年
4 王琦;;基于贝叶斯决策树算法的垃圾邮件识别机制[A];2011年通信与信息技术新进展——第八届中国通信学会学术年会论文集[C];2011年
5 通拉嘎;赵小兵;;论蒙古语词素切分的实现[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
6 刘凯;王志洋;于惠;孙萌;宋林峰;李佳正;何晋一;孟凡东;刘洋;吕雅娟;刘群;;2011全国机器翻译研讨会计算所系统描述[A];机器翻译研究进展——第七届全国机器翻译研讨会论文集[C];2011年
7 鲁松;;英文介词短语归并歧义的RMBL分类器消解[A];2005年信息与通信领域博士后学术会议论文集[C];2005年
8 刘海霞;钟晓妮;周燕荣;田考聪;;决策树在居民就诊卫生服务利用影响因素研究中的应用[A];重庆市预防医学会2010年论文集[C];2011年
9 汪云亮;吕久明;刘孝刚;;基于信息熵的辐射源属性分类方法[A];2006北京地区高校研究生学术交流会——通信与信息技术会议论文集(上)[C];2006年
10 叶中行;陆青;余敏杰;;计算智能在银行信贷信用分类中的应用[A];中国电子学会第十五届信息论学术年会暨第一届全国网络编码学术年会论文集(下册)[C];2008年
中国博士学位论文全文数据库 前10条
1 时长江;豆科类杂草种子图像识别系统研究[D];中国海洋大学;2009年
2 全惠敏;电能质量相关信号的S变换检测算法及应用研究[D];湖南大学;2010年
3 张明;电能质量扰动相关问题研究[D];华中科技大学;2010年
4 曾智刚;波浪运动升沉补偿液压平台关键问题试验研究[D];华南理工大学;2010年
5 高山;蛋白质点突变效果预测与突变数据库研究[D];南开大学;2010年
6 渠瑜;基于SVM的高不平衡分类技术研究及其在电信业的应用[D];浙江大学;2010年
7 曹葵康;支持向量机加速方法及应用研究[D];浙江大学;2010年
8 徐河杭;面向PLM的数据挖掘技术和应用研究[D];浙江大学;2010年
9 朱佳俊;不确定可拓群决策优化方法及应用[D];东华大学;2010年
10 林龙信;仿生水下机器人的增强学习控制方法研究[D];国防科学技术大学;2010年
中国硕士学位论文全文数据库 前10条
1 李金华;基于SVM的多类文本分类研究[D];山东科技大学;2010年
2 韩晓峰;高斯混合模型及在探测网络社区结构中的应用[D];山东科技大学;2010年
3 岳海亮;信息论在粗糙集连续属性离散化中的应用[D];辽宁师范大学;2010年
4 杨勇;基于SOA的浙江永康某小家电企业应用系统集成平台开发与应用[D];浙江理工大学;2010年
5 石国强;基于规则的组合分类器的研究[D];郑州大学;2010年
6 王利明;一种基于PMIPv6的智能辅助高效切换方案[D];郑州大学;2010年
7 王庆丽;火电厂负荷经济调度算法研究及锅炉热经济性诊断[D];郑州大学;2010年
8 左维松;规则和统计相结合的篇章情感倾向性分析研究[D];郑州大学;2010年
9 刘阳;基于框架语义学的语篇连贯研究[D];哈尔滨工程大学;2010年
10 刘洋;基于本体的医保审计知识库构建研究[D];哈尔滨工程大学;2010年
【二级参考文献】
中国期刊全文数据库 前10条
1 杨新武,刘椿年;遗传归纳逻辑程序设计中规则的位串表示法[J];北京工业大学学报;2001年03期
2 朱靖波,姚天顺;词义自动消歧概率模型[J];东北大学学报;2000年05期
3 肖明忠,廖全萍,陈笑蓉;自然语言理解新思路─HNC[J];贵州大学学报(自然科学版);2000年02期
4 郭艳华,周昌乐;自然语言理解研究综述[J];杭州电子工业学院学报;2000年01期
5 陈雪荣,席旭刚,罗志增;利用IBM ViaVoice实现装配机器人的听觉功能[J];杭州电子工业学院学报;2001年03期
6 鲁川,林杏光;现代汉语语法的格关系[J];汉语学习;1989年05期
7 周会平,王挺,陈火旺;汉英翻译系统ICENT的中间语言设计[J];计算机研究与发展;2000年03期
8 陆建江,钱祖平,宋自林;正态云关联规则在预测中的应用[J];计算机研究与发展;2000年11期
9 陆建江;加权关联规则挖掘算法的研究[J];计算机研究与发展;2002年10期
10 杨新武,刘椿年;遗传归纳逻辑程序设计的个体编码生长现象[J];计算机研究与发展;2003年08期
【相似文献】
中国期刊全文数据库 前10条
1 黄艳娟;模糊检索方法研究[J];计算机工程与设计;2004年07期
2 赵慧;李春明;;一种受限领域中自然语言提问的处理方法[J];计算机与信息技术;2005年12期
3 郭庆琳;樊孝忠;柳长安;;基于文本聚类的自动文摘系统的研究与实现[J];计算机工程;2006年04期
4 黄维金;顾益军;赵勋平;;基于自然语言理解的Web敏感信息监控[J];中国人民公安大学学报(自然科学版);2006年01期
5 闫晔;朱华勇;沈林成;;基于自然语言理解的UAV指令理解系统设计[J];计算机仿真;2007年11期
6 叶星火;胡珀;张小鹏;;基于特征信息提取的中文自动文摘方法[J];计算机应用与软件;2008年05期
7 许珺;;对于线状地理特征空间关系的自然语言理解[J];地球信息科学;2008年03期
8 谭俊明;;自然语言的理解综述[J];科技广场;2008年05期
9 罗洋;;基于综合的自动文摘方法研究[J];牡丹江师范学院学报(自然科学版);2009年03期
10 黄莉;;浅析汉语问答系统中的句子检索方法[J];价值工程;2010年14期
中国重要会议论文全文数据库 前10条
1 苗传江;;HNC理论的句类[A];面向21世纪的科技进步与社会经济发展(上册)[C];1999年
2 康海燕;樊孝忠;马礼;;自然语言理解的检索技术在数字图书馆中的应用[A];第二十届全国数据库学术会议论文集(技术报告篇)[C];2003年
3 陈晓红;何晓洁;李一智;;自然语言理解在智能决策支持系统人机接口中的应用[A];全国青年管理科学与系统科学论文集(第2卷)[C];1993年
4 郭晨;;汉语语音技术[A];第一届学生计算语言学研讨会论文集[C];2002年
5 乐明;冯志伟;;RST的理论发展和工程应用综述[A];第二届全国学生计算语言学研讨会论文集[C];2004年
6 彭双和;韩臻;沈昌祥;;应用安全策略基础设施构筑积极防御的应用边界安全设备[A];第十九次全国计算机安全学术交流会论文集[C];2004年
7 车万翔;刘挺;李生;;语义角色标注的方法与挑战[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
8 潘城;王斌;;一种带比例因子的模糊控制器[A];第三届全国控制与决策系统学术会议论文集[C];1991年
9 乐明;冯志伟;;篇章修辞结构树库概述[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
10 车万翔;刘挺;李生;;自动浅层语义分析[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
中国重要报纸全文数据库 前10条
1 ;美国拟定非道路发动机和设备的排放控制规则[N];中国国门时报;2007年
2 江南;黄金期货风险控制规则考量“炒金者”[N];第一财经日报;2007年
3 ;世界越来越小 市场越来越大[N];江苏经济报;2000年
4 本报记者 姜靖;张全:给网络装上“电子眼”[N];科技日报;2009年
5 若水;理光工业: 网络需要清澈洁净[N];中国计算机报;2006年
6 ;防火墙替换:说起来容易做起来难[N];网络世界;2006年
7 小柯;张全:网络环境“清洁师”[N];广东科技报;2009年
8 陆元婕;聪明的搜索引擎[N];中国计算机报;2001年
9 杨保国;中国科大研制的机器人会说话能干活[N];科技日报;2009年
10 百瑞信托风险管理部副总经理 杨峰;建立信托公司全面风险管理体制[N];证券时报;2006年
中国博士学位论文全文数据库 前10条
1 许中卫;基于双向搜索的ILP算法构建汉语语义自动切分系统[D];安徽大学;2006年
2 钟美;基于Web的空间本体构建方法研究[D];武汉大学;2010年
3 陈晓云;文本挖掘若干关键技术研究[D];复旦大学;2005年
4 金海松;轿车信息集中控制系统的关键技术研究[D];武汉理工大学;2005年
5 刘根辉;计算语用学基础理论及其应用研究[D];华中科技大学;2005年
6 张蕾;概念结构及其应用[D];西北工业大学;2001年
7 乐明;汉语财经评论的修辞结构标注及篇章研究[D];中国传媒大学;2006年
8 杨芸;汉语隐喻识别与解释计算模型研究[D];厦门大学;2008年
9 朱宏辉;基于知识驱动的拟人智能控制系统若干关键技术研究[D];武汉理工大学;2006年
10 章文俊;基于接线模式的配电网络优化规划[D];上海交通大学;2009年
中国硕士学位论文全文数据库 前10条
1 刘海涛;基于自然语言理解的中文搜索引擎[D];河北科技大学;2011年
2 蔡霞;基于自然语言理解的个性化Web 数据挖掘系统的设计及实现方法研究[D];浙江工业大学;2003年
3 程培涛;机械产品设计领域自然语言理解中的概念从属树研究与实现[D];西安电子科技大学;2005年
4 王会彩;面向领域的自然语言理解中歧义处理、控制及其在产品设计中的应用[D];西安电子科技大学;2010年
5 焦海涛;机械设计领域自然语言理解知识库构建研究[D];西安电子科技大学;2004年
6 杨俊梅;产品设计中含有特殊动词复合句的自然语言理解的研究与实现[D];西安电子科技大学;2005年
7 李海林;自然语言理解及其在机务信息规范化中的应用[D];南京航空航天大学;2004年
8 亿珍珍;面向产品设计的自然语言理解语义分析研究[D];西安电子科技大学;2004年
9 赵亮;自然语言理解中基于本体的概念区分研究及其在智能仪器设计领域的应用[D];西安电子科技大学;2011年
10 吴中兴;面向机械设计领域的概念从属树模型研究及实现[D];西安电子科技大学;2004年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026