收藏本站
《苏州大学》 2009年
收藏 | 手机打开
二维码
手机客户端打开本文

指代消解关键问题研究

孔芳  
【摘要】: 随着计算机技术和互联网的迅速发展,各种信息呈爆炸式增长,人们对信息精确定位的需求促进了自然语言处理技术的研究。指代消解是自然语言处理的重点和难点之一,在文本摘要、机器翻译、多语言信息处理和信息抽取等诸多应用中都涉及到指代消解问题。而指代消解又综合了多种自然语言处理技术,它的解决依赖于词性标注、命名实体识别、名词短语识别、句法分析、语义分析等众多相关技术。 本文首先深入分析了现有的指代消解技术,并对其进行了归纳总结,给出了目前指代消解领域主要存在的问题和不足,并进一步给出了该领域当前的研究热点和趋势。作为研究基础,本文参考Soon等(2001)给出的经典指代消解基本框架构建了一个性能良好的指代消解基准平台,与国际上一些出色的指代消解系统相比,该平台在MUC-6和ACE2003上的性能均达到了国际领先水平。在此基础上,本文从以下三方面展开了深入研究: 第一,基于中心理论的指代消解研究。在中心理论的指导下,借助语义角色将中心理论从语法层扩展到语义层,并提取了与之相关的三组特征:语义角色特征,代词阶特征和代词子类别特征。在ACE 2003语料上进行的各类实验都表明,这三组特征能极大地提升了指代消解的性能,特别是代词消解的性能。同时,实验也表明,它们不仅对短距离指代关系的消解有益,对长距离指代关系的消解也很有帮助。 第二,基于树核函数的指代消解研究。在深入研究平面特征的基础上对结构化信息在指代消解中的应用进行了探索。重点研究了多种捕获结构化信息的方案,并通过实验分析了它们的优缺点。例如,在中心理论的指导下,增强了先行语候选词所在位置的句法描述;根据双候选模型,增加了先行语候选词的竞争者信息;在结构化信息中引入语义角色及代词类别等信息。在ACE 2004英文语料中的实验表明,基于树核函数的方法大大提高了英文指代消解的性能,特别是当前句代词消解的性能。同时,在ACE 2005中文语料中的实验表明,基于树核函数的方法同样大大提高了中文指代消解的性能,这表明结构化信息对指代消解而言是非常重要的,而且是语言无关的。 第三,指代消解中待消解项的自动识别研究。探讨了基于规则、平面特征和树核等三种待消解项识别方法,并将这三种待消解项识别方法分别应用于指代消解,通过对实验数据的分析阐述了待消解项识别对指代消解的作用。
【学位授予单位】:苏州大学
【学位级别】:博士
【学位授予年份】:2009
【分类号】:TP301

【参考文献】
中国期刊全文数据库 前9条
1 王厚峰;指代消解的基本方法和实现技术[J];中文信息学报;2002年06期
2 孔祥勇,张冬茉;一种信息抽取系统中汉语同指消解算法[J];计算机工程;2003年16期
3 王厚峰,何婷婷;汉语中人称代词的消解研究[J];计算机学报;2001年02期
4 许敏,王能忠,马彦华;汉语中指代问题的研究及讨论[J];西南师范大学学报(自然科学版);1999年06期
5 李国臣,罗云飞;采用优先选择策略的中文人称代词的指代消解[J];中文信息学报;2005年04期
6 王凌飞,张玉敏,李堂秋;汉英机译系统中指代的确定 [J];计算机应用研究;2000年09期
7 王晓斌,周昌乐;基于语篇表述理论的汉语人称代词的消解研究[J];厦门大学学报(自然科学版);2004年01期
8 张 威,周昌乐;汉语语篇理解中元指代消解初步[J];软件学报;2002年04期
9 王厚峰,梅铮;鲁棒性的汉语人称代词消解[J];软件学报;2005年05期
【共引文献】
中国期刊全文数据库 前10条
1 刘华富;支持向量机Mercer核的若干性质[J];北京联合大学学报;2005年01期
2 刘华富;一种快速支持向量机分类算法[J];长沙大学学报;2004年04期
3 桑海峰;王福利;何大阔;张大鹏;;发酵过程中生物量浓度的在线估计[J];东北大学学报(自然科学版);2006年06期
4 杨晓江;李丽娟;田俊华;李艺;;面向基础教育的Web资源垂直服务体系研究[J];中国远程教育;2006年07期
5 王炜,刘悦,李国正,吴耿锋,林命周,马钦忠,赵利飞;中国大陆强震时间序列预测的支持向量机方法[J];地震;2005年04期
6 王炜;刘悦;李国正;吴耿锋;马钦忠;赵利飞;林命週;;我国大陆强震预测的支持向量机方法[J];地震学报;2006年01期
7 周莉;刘开培;马秉伟;;基于支持向量机的电力系统频率测量新方法[J];高电压技术;2006年06期
8 吴建生,金龙;神经网络的统计学习理论基础[J];广西科学院学报;2005年02期
9 李志明;孔令富;;用于回归估计的支持向量机[J];广西科学院学报;2005年04期
10 袁小芳,王耀南,孙炜,杨辉前;一种用于RBF神经网络的支持向量机与BP的混合学习算法[J];湖南大学学报(自然科学版);2005年03期
中国重要会议论文全文数据库 前10条
1 李玉良;王良松;李晶;;图像中数字字符识别技术概览[A];节能环保 和谐发展——2007中国科协年会论文集(一)[C];2007年
2 王治敏;俞士汶;;人称代词和名词的歧义消解研究[A];第六届汉语词汇语义学研讨会论文集[C];2005年
3 肖惠玲;曾翎;黄海莹;张琳;王昱清;杨勤;陈华富;;支持向量机探测脑功能活动[A];中国生物医学工程进展——2007中国生物医学工程联合学术年会论文集(下册)[C];2007年
4 王永春;;一种复合的支持向量机模型在电力系统短期负荷中的应用[A];第十届全国电工数学学术年会论文集[C];2005年
5 谭斌;;指代消解的原理和实现方法[A];2008'中国信息技术与应用学术论坛论文集(二)[C];2008年
6 俞士汶;;计算语言学的应用研究与基础研究[A];辉煌二十年——中国中文信息学会二十周年学术会议论文集[C];2001年
7 罗云飞;李国臣;;采用优先选择策略的中文人称代词的指代消解[A];第二届全国学生计算语言学研讨会论文集[C];2004年
8 杨佳;;基于语料分析的“这/那+NP”的指代消解算法[A];第二届全国学生计算语言学研讨会论文集[C];2004年
9 郎君;刘挺;秦兵;;基于决策树的中文名词短语指代消解[A];第二届全国学生计算语言学研讨会论文集[C];2004年
10 梅铮;王厚峰;;汉语人称代词消解的前端处理[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
中国博士学位论文全文数据库 前10条
1 马红妹;汉英机器翻译中汉语上下文语境的表示与应用研究[D];中国人民解放军国防科学技术大学;2002年
2 郑逢斌;关于计算机理解自然查询语言的研究[D];西南交通大学;2004年
3 薛海涛;铝合金点焊质量信息化技术的研究[D];天津大学;2004年
4 于满泉;面向人物追踪的知识挖掘研究[D];中国科学院研究生院(计算技术研究所);2006年
5 姚红玉;基于教师专业化发展的虚拟导师系统设计[D];华东师范大学;2006年
6 张义荣;基于机器学习的入侵检测技术研究[D];国防科学技术大学;2005年
7 张国云;支持向量机算法及其应用研究[D];湖南大学;2006年
8 王智强;汉语指代消解及相关技术研究[D];北京邮电大学;2006年
9 谢学敏;基于动态流通语料库(DCC)的流行语释义信息自动提取研究[D];北京语言大学;2006年
10 梁新荣;高速公路智能控制方法研究[D];华南理工大学;2005年
中国硕士学位论文全文数据库 前10条
1 朱钦隽;计算机汉语理解的初步实践[D];电子科技大学;2001年
2 曹军;汉语第三人称代词消解方法研究[D];湘潭大学;2002年
3 詹思瑜;自然语言的计算机处理模型[D];电子科技大学;2003年
4 张占英;关于数据库汉语查询语句中查询信息的研究[D];河南大学;2004年
5 曹宏鑫;基于SVM的网络入侵检测研究[D];南京理工大学;2004年
6 肖伟;数据挖掘在网络故障诊断中的应用[D];南京理工大学;2004年
7 李新军;基于支持向量机的建模预测研究[D];天津大学;2004年
8 李力;利用知网进行(计算机)自然语言处理[D];电子科技大学;2004年
9 胡立萍;微生物青贮剂制备中酵母菌发酵过程DO的预测控制[D];江南大学;2005年
10 黄琼英;支持向量机多类分类算法的研究及应用[D];河北工业大学;2005年
【二级参考文献】
中国期刊全文数据库 前9条
1 秦洪武;第三人称代词在深层回指中的应用分析[J];当代语言学;2001年01期
2 刘海军,黄河燕,陈肇雄;智能机器翻译系统中的语境处理[J];计算机研究与发展;1998年04期
3 李国臣,段建勇;基于模糊集的名词细分类研究[J];计算机工程;2004年01期
4 王厚峰,何婷婷;汉语中人称代词的消解研究[J];计算机学报;2001年02期
5 王凌飞,张玉敏,李堂秋;汉英机译系统中指代的确定 [J];计算机应用研究;2000年09期
6 王厚峰;指代消解的基本方法和实现技术[J];中文信息学报;2002年06期
7 张 威,周昌乐;汉语语篇理解中元指代消解初步[J];软件学报;2002年04期
8 许敏,王能忠,马彦华;汉语中指代问题的研究及讨论[J];西南师范大学学报(自然科学版);1999年06期
9 刘志文,郝惠宁,肖友芙,黄曾阳;自然语言语句的HNC表示[J];语言文字应用;1998年02期
【相似文献】
中国期刊全文数据库 前10条
1 李凡;刘启和;李洪伟;;基于Fuzzy Rough集模型的汉语人称代词消解[J];计算机科学;2010年01期
2 孔芳;周国栋;朱巧明;钱培德;;指代消解综述[J];计算机工程;2010年08期
3 盛娜;;国际金融中心研究综述——从跨国银行地区总部角度[J];金卡工程(经济与法);2010年05期
4 伍守芹;李晓昀;;信息抽取技术研究与探讨[J];福建电脑;2010年04期
5 刘枫;;传播研究中的“中心理论贫乏现象”分析[J];新闻界;2010年02期
6 周婉萍;;提高职业学校图书馆管理的顾客满意度[J];农业图书情报学刊;2010年08期
7 刘玉玲;辛国江;;篇章层自然语言数字水印方法[J];计算机工程;2010年12期
8 吴敏;;指代消解在普通语言学理论与课程实践上的应用研究[J];大家;2010年11期
9 谭魏璇;孔芳;王海东;周国栋;;使用树核函数进行中文代词消解的研究[J];计算机工程与应用;2010年24期
10 麦范金;李东普;甘国庆;;基于指代消解的自动文摘方法研究[J];情报理论与实践;2010年10期
中国重要会议论文全文数据库 前10条
1 何靖;陈翀;闫宏飞;;开放域问答系统研究综述[A];第六届全国信息检索学术会议论文集[C];2010年
2 张伟男;张宇;刘挺;;基于中心理论的中文对话省略恢复研究[A];第六届全国信息检索学术会议论文集[C];2010年
3 伊力亚尔·加尔木哈买提;尼亚子别克·阿不都加勒力;;哈萨克文自动文本摘要方法浅谈[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年
4 晏国祥;;透析“营销是科学还是艺术”之争[A];中国市场营销创新与发展学术研讨会论文集[C];2009年
5 桂卓民;何婷婷;陈劲光;李芳;;一种面向查询的多文档自动文摘系统实现方法[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
6 刘茂福;金可佳;姬东鸿;张晓龙;;统计与规则相结合的指代消解在事件自动文摘中的应用[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
7 伍学进;;试论城市的窄街道、小街区系统[A];城市规划和科学发展——2009中国城市规划年会论文集[C];2009年
8 杜志娟;;多中心理论视角下公共体育服务供给模式的研究[A];全民健身科学大会论文摘要集[C];2009年
9 谭斌;;指代消解的原理和实现方法[A];2008'中国信息技术与应用学术论坛论文集(二)[C];2008年
10 王海东;谭魏旋;周国栋;;语义角色在指代消解中的研究[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
中国重要报纸全文数据库 前10条
1 通讯员 喀组研;我区积极推进学习型领导班子建设[N];喀什日报(汉);2010年
2 通讯员 孙利;灌云审计局打造廉洁型审计机关[N];连云港日报;2010年
3 通讯员 杨和;英吉沙以良好学风促干部作风转变[N];喀什日报(汉);2010年
4 齐立民 张士军;创建学习型党组织当典范[N];北大荒日报;2010年
5 任俊青;立足“三个加强”提升党建水平[N];北大荒日报;2010年
6 通讯员 喀组研;我区组织系统扎实开展“四带头四提高”活动[N];喀什日报(汉);2010年
7 记者 张静伟;市中法学习贯彻干部选拔任用“四项监督制度”[N];拉萨晚报;2010年
8 杨宏军;开展“五个创建”活动 推动学习型组织建设[N];北大荒日报;2010年
9 张肖雯 编译;“自私的声音”:语言学中的达尔文主义[N];中国社会科学报;2010年
10 洛文;美媒:中国发展不能步美国后尘[N];国防时报;2010年
中国博士学位论文全文数据库 前6条
1 王会寨;公共服务视野下的中国体育行政管理体制改革[D];北京体育大学;2009年
2 王智强;汉语指代消解及相关技术研究[D];北京邮电大学;2006年
3 段嫚娟;向心理论的参数化研究及其在汉语指代消解中的应用[D];上海外国语大学;2006年
4 秦玲;草炭保水保肥特性与葡萄根区不同施用模式效应的研究[D];西北农林科技大学;2005年
5 杨永福;“规则”的分析与建构:制度的社会网络基础[D];武汉理工大学;2003年
6 卢再奇;弹载毫米波雷达目标识别实现技术研究[D];国防科学技术大学;2002年
中国硕士学位论文全文数据库 前10条
1 陆长生;中文跨文档指代消解的研究与实现[D];苏州大学;2010年
2 陈九昌;指代消解中待消解项识别研究[D];苏州大学;2010年
3 孙中友;基于主题的事件融合技术的研究与实现[D];苏州大学;2010年
4 黄李伟;中文零指代消解研究[D];苏州大学;2010年
5 谭魏璇;命名实体与基本名词短语识别研究[D];苏州大学;2010年
6 陈帅;面向篇章的代词指代消解及其在机械产品设计中的应用[D];西安电子科技大学;2009年
7 吴波;我国转型时期多元参与城市治理模式研究[D];电子科技大学;2009年
8 徐向科;转型期乡村庇护网络与基层治理变迁研究[D];复旦大学;2009年
9 万洪杰;惠特曼《草叶集》的女性主义解读[D];中国海洋大学;2009年
10 金可佳;统计与规则相结合的指代消解[D];武汉科技大学;2009年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026