收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

向心理论的参数化研究及其在汉语指代消解中的应用

段嫚娟  
【摘要】:向心理论是一个有关语篇连贯和显著性的理论。自提出以来,该理论已被广泛的运用于指代消解,语篇连贯性分析等领域。但是向心理论的提出者,为了使该理论能被广泛地用于解释不同语言中的语言现象,并未对向心理论中的核心概念,如语句(utterance),前瞻中心(C_f)的排序(ranking),实现(realization),以及R1代词的定义进行严格的限定。在具体的指代消解算法实现中,需要对上述概念分别进行参数化的分析,以获得相对于具体指代消解任务的最佳参数设定。 本文在向心理论参数化研究的基础上,综合分析了各种基于向心理论的指代消解算法,并对向心理论在汉语指代消解中参数设定进行了实证性研究。 本文收集了来自三种语篇类型的共三万多字的语料,其中名词短语5148个。首先我们给这些名词短语标注上语法功能以及数和性等特征,然后编写程序将语料中的名词短语信息自动存入一个Access语料库。根据研究目的的需要,本文一共设计了六个基于向心理论的指代消解算法,每个算法实现一种不同的参数设定,这些算法在数据库提供的名词信息基础上对语料中的代词和零形代词进行消解。 本文研究的向心理论的参数有:语句的定义,前瞻中心的排序,以及R1代词的选定。 对于语句的定义,我们考察了两种可能的语句定义,一是将语句定义为至少包含一个述谓结构的,用标点符号隔开的语段;二是将语句定义为句子。这两种语句划分的方法在文中分别记为Udef.1和Udef.2。研究结果表明,在Udef.1划分下,零形代词的消解正确率远远高于Udef.2。然而,在这两种语句划分对于代词消解的正确率的影响不如对零形代词消解明显。 本文考察的前瞻中心排序影响因素有:语篇实体的出现顺序,语篇实体的语法角色,语法角色平行因素,后指中心(C_b)延续,和语篇实体出现的句法层次。消解结果表明,语篇实体的语法角色,相对于语篇实体出现的线形顺序,更能精确忠实地反映语篇实体的显著性。在指代消解中引入语法角色平行因素对于代词和零形代词消解均有积极的影响,这种影响在语句按照Udef.2划分的情况下更为显著。本文研究发现将C_b的延续性倾向引入指代消解算法并没有给消解结果带来积极的影响,而且在某些参数设定下,引入C_b延续性考虑还会给指代消解带来负面影响。这说明向心理论中提出的“语篇实体连贯性”(entity coherence)并不是语篇实现连贯的唯一途径。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 雨丝;;108个瓶子让他不再小看自己[J];青年科学;2007年01期
2 陈肇雄,王英姿;我国智能型机器翻译研究获重要成果[J];中国科学基金;1997年03期
3 张禄彭;;面向自然语言处理的歧义概念[J];解放军外国语学院学报;2007年05期
4 秦玮远;;自然语言中副语言的逻辑处理[J];现代语文(语言研究版);2007年07期
5 田怀凤;;基于多策略的专业术语抽取处理技术的研究[J];计算机与现代化;2008年12期
6 冯志伟;;自然语言处理中的一些宏观问题之我见[J];中国外语;2009年05期
7 常宝宝;;自然语言分析与生成术语简介[J];术语标准化与信息技术;2010年04期
8 徐臻;;试论语言工程的开发[J];黑龙江高教研究;1984年02期
9 F·Z·;自然语言处理学术讨论会在京举行[J];语文建设;1989年04期
10 黄昌宁,周明;亚太地区自然语言处理的学术盛会——记在韩国汉城召开的NLPRS’95[J];当代语言学;1996年02期
11 吕西安·马尔柰夫,保尔·若利昂;简论自然语言处理的连接网络法[J];中文信息学报;1997年02期
12 傅兴尚;俄语词汇知识库在NLP中的运作机制[J];外语学刊;2002年03期
13 陆俭明;;要重视特征的研究与描写[J];长江学术;2006年01期
14 魏长宏;张春柏;;机器翻译的译后编辑[J];中国科技翻译;2007年03期
15 刘海涛;冯志伟;;自然语言处理的概率配价模式理论[J];语言科学;2007年03期
16 赵铁军;朱聪慧;;世界最大的自然语言处理和语音技术实验室——哈尔滨工业大学语言语音教育部-微软重点实验室[J];计算机教育;2007年11期
17 蒋本蓉;;《现代俄语详解组合词典》评述[J];辞书研究;2008年03期
18 许余龙;段嫚娟;付相君;;“语句”与“代词”的设定对指代消解的影响——一项向心理论参数化实证研究[J];现代外语;2008年02期
19 李可胜;;语言学中的形式语义学[J];中国社会科学院研究生院学报;2009年02期
20 肖磊;;《左传》地名研究初探[J];文教资料;2009年18期
中国重要会议论文全文数据库 前10条
1 郎君;刘挺;李生;张会鹏;;基于XML的开放式语言技术平台:LTP[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
2 郎君;刘挺;张会鹏;李生;;LTP:语言技术平台[A];第三届学生计算语言学研讨会论文集[C];2006年
3 周国栋;孔芳;朱巧明;;指代消解:国内外研究现状及趋势[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
4 刘群;张浩;白硕;;中文信息处理开放平台的设计[A];第一届学生计算语言学研讨会论文集[C];2002年
5 支流;朱学锋;段慧明;俞士汶;;中文缩略语还原技术初探[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
6 支流;段慧明;朱学锋;俞士汶;;中文缩略语知识库建设[A];第三届学生计算语言学研讨会论文集[C];2006年
7 葛诗利;陈潇潇;;中国EFL学习者自动作文评分探索[A];第三届学生计算语言学研讨会论文集[C];2006年
8 刘开瑛;由丽萍;;汉语框架语义知识库构建工程[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
9 郑家恒;谭红叶;王兴义;;基于模式匹配的中文专有名词识别[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年
10 宋柔;;自然语言处理中语言知识的基础性地位[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年
中国博士学位论文全文数据库 前10条
1 段嫚娟;向心理论的参数化研究及其在汉语指代消解中的应用[D];上海外国语大学;2006年
2 孙珊珊;向心理论的参数设定及其在英汉指代消解中的应用研究[D];上海外国语大学;2011年
3 王智强;汉语指代消解及相关技术研究[D];北京邮电大学;2006年
4 孔芳;指代消解关键问题研究[D];苏州大学;2009年
5 李凡;Rough集理论及其应用中若干问题的研究[D];电子科技大学;2008年
6 任飞亮;高适应性基于实例的机器翻译中关键技术研究[D];东北大学;2008年
7 卢延鑫;基于自然语言处理技术的循证医学信息提取研究[D];复旦大学;2011年
8 李良炎;基于词联接的自然语言处理技术及其应用研究[D];重庆大学;2004年
9 周雅倩;最大熵方法及其在自然语言处理中的应用[D];复旦大学;2005年
10 易勇;计算机辅助诗词创作中的风格辨析及联语应对研究[D];重庆大学;2005年
中国硕士学位论文全文数据库 前10条
1 陈九昌;指代消解中待消解项识别研究[D];苏州大学;2010年
2 陆长生;中文跨文档指代消解的研究与实现[D];苏州大学;2010年
3 黄李伟;中文零指代消解研究[D];苏州大学;2010年
4 倪吉;中文人名跨文档指代消解研究[D];苏州大学;2011年
5 叶其松;NP构句块的模式化及自动识别[D];黑龙江大学;2004年
6 侯丽敏;基于网络的智能答疑系统的研究与实现[D];河南大学;2005年
7 周舫;汉语句子相似度计算方法及其应用的研究[D];河南大学;2005年
8 全昌勤;基于语料库的汉语词义消歧方法研究[D];华中师范大学;2005年
9 周美希;汉语语句组块及消歧的研究与实现[D];电子科技大学;2005年
10 张涛;中文文本中未知词语的词义知识获取[D];山西大学;2005年
中国重要报纸全文数据库 前10条
1 本报记者 姜靖;张全:给网络装上“电子眼”[N];科技日报;2009年
2 本报记者 祝蕾 见习记者 许凯;李晓戈:努力缩小国内外数字“鸿沟”[N];济南日报;2010年
3 金利;东北大学自然语言处理实验室形成特色[N];科技日报;2007年
4 小柯;张全:网络环境“清洁师”[N];广东科技报;2009年
5 何清 史忠植 王伟;搜索引擎的前沿技术[N];计算机世界;2006年
6 沈建缘;洪小文:时尚科学家[N];经济观察报;2009年
7 郑昊;数据挖掘加工海量数据[N];中国计算机报;2007年
8 记者 刘传书;微软在深圳设实验室[N];科技日报;2006年
9 安信;均线的运用技巧(六)[N];潮州日报;2008年
10 ;开天辟地第一回[N];计算机世界;2002年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978