收藏本站
《复旦大学》 2006年
收藏 | 手机打开
二维码
手机客户端打开本文

汉语篇章零回指的解析与生成:一项基于语料的向心研究

许宁云  
【摘要】: 回指是自然语言中最为常见的现象之一,因而回指解析与生成对于语篇理解和生成至关重要。零形回指在汉语语篇中应用广泛,然而解析和生成零形回指却是一项较为棘手的任务,因为汉语中的零形回指可充当各种论元角色,且先行词也可以出现于任一语法位置。到目前为止,许多学者从不同角度探讨了汉语零形回指的解析与生成方法,其中最为普遍的是从句法角度(Huang J.,1984,1989;XuL.J.,1986),语篇功能角度(Li and Thompson,1979,1981;Chen,1986;Xu J.J.,1990,2003;Tao,1993,1997;Cheng,1990;Lee,1990,1995;You,1998;Xu Y L.,1995,2004),语用角度(Huang Y,1994)以及认知角度(Tomlin and Pu,1991)。然而这些研究在很大程度上还是停留于‘解释’阶段,因而不能成为真正意义上的‘解析’与‘生成’。而且这些研究不够明晰化且应用性较弱,不太适用于计算机处理。 本研究旨在推导出用于解析和生成汉语语篇零形回指的计算模型。向心理论(Centering Theory,Grosz et al.1995;Walker et al.1998,inter alia)是当前计算机语言学中用于语篇回指解析与生成的主要理论模式之一。为了验证该理论中规则和限制条件的跨语言适用性,许多学者将其应用于各种语言的回指解析与生成。其中有些学者将其应用于零形回指的解析与生成(Kameyama,1985,1986,1988,1998;Walker,Iida,and Cote,1990,1994;Mitsuko et al.,2001;Turan,1995,1998;DiEugenio,1990;Rambow,1993;Ryu,2001;Prasad,2003;Prince,1994)。然而在国内,很少有学者将向心理论应用于汉语语篇回指解析与生成。从已发表的文献中,笔者只发现两篇有关向心理论的文章。一篇是(Miao,2003),另一篇是(Wang,2004)。Miao(2003)对向心理论进行了评介,但没有将其应用于汉语语篇分析;Wang(2004)将向心理论应用于汉语语篇零形回指的解析,但他使用的算法是采用Iida(1998)的宏观模型(Global Model),而且对于许多细节问题都没有进行深入探讨。基于以上情况,本研究拟将向心理论全面而系统地应用于汉语语篇分析,从而推导出用于解析和生成汉语语篇零形回指的计算模型。 本研究将向心理论作为理论框架。推导出的第一个计算模型是汉语零形回指解析模型,称为RICM(Revised Integrated Cache Model)。此模型是对Walker(1996)集成贮藏模型(Imegrated Cache Model)的改进,它吸取了Walker(1996)的‘反堆栈’(anti-stack)思想,并利用了Cheng(1990)和Lee(1990,1995)的找回原则(Recovery Principles),因为词汇语义可作为寻找指称对象的理想寻找提示语(retrieval cues)。 具体来说,本研究修订了第一向心规则(或称代词规则),并制定了其他六个规则,即下指中心排序规则(the Cf Ranking rule)、下指中心提升规则一(theCf Promotion ruleⅠ)、下指中心提升规则二(the Cf Promotion ruleⅡ)、下指中心迁移规则(the Cf Transfer rule,)、下指中心删除规则(the Cf Deletion rule)以及下指中心移出规则(the Cf Displacement rule)。基于以上规则,本研究推导出汉语零形回指的解析模型和算法。与堆栈模型(Crosz and Sidner 1986)、宏观模型(Iida 1998)和贮藏模型(Walker 1996)相比,此模型的优点是既可以不求助于宏观排序列表来解析跨语段零形回指,还可以解决排序较低实体充当回指中心的问题。 为了验证本解析算法的有效性,我们进行了实证研究,所采用的语料是选自 《中国民间故事选粹》中的18篇短篇故事。实验结果表明,在语料中出现的所有零形回指中,95%都被本算法成功解析,因此本算法是有效可行的,因为算法的解析正确率为95%。 本研究推导出的第二个计算模型是汉语零形回指生成模型。此模型将向心过渡类型(Centering Transitions)作为回指词分布的限定条件,因为过渡类型是生成回指形式的有效方法之一(Turan 1995;Kim 1999;Ryu 2000)。本研究从语料中提取出所有相关的过渡类型,并基于这些过渡类型推导出零形回指生成算法。通过语料验证,此算法的生成准确率高达96.75%,因此此算法是有效可行的。 由于向心理论具有跨语言的特征,因此必须对其参数进行适当的修订,以便对汉语语篇进行应用分析。这些参数包括语段定义、语篇片段切分和下指中心集排序。 语段(utterance)是语篇组织的基本单位。基于先前的定义方法(Li,1956;Hu,1981;Huang Liao,1981;Mann and Thompson 1987;Crystal 1991;Zhu,1995;Poesio 1995;Traum Heeman 1996;Bussmann 1996;Chu 1998;Kameyama 1998;Aronoff Rees-Miller 2001;Song,2001;Xu,2003),本研究推导出语段的定义方法,此方法适用于汉语语篇的向心分析,因为它既符合汉语的句子特征,又便于计算机处理。 语篇可切分为一个个语篇片段(discourse segrnent),但语篇片段的切分标准和方法却尚无定论。为避免出现无回指中心(Nil)和零过渡类型(NO Cb),并基于Cheng(1990)的话题连续段(topic continuity),本研究推导出适用于汉语语篇向心分析的语篇片段切分方法。此切分方法具有如下四个优点:1)能避免因过度切分而导致的过多的无回指中心和零过渡类型,因此可使较多的过渡类型参与决定回指形式的分布;2)能有效解决向心与宏观语篇结构的互动,以及将向心应用于拓展语篇等问题;3)可使可推导实体(inferables)作为后续语段指称的潜在指称对象;4)它尤其适用于汉语语篇的向心分析,因为在汉语语篇中,跨语段指称和跨段落指称较为普遍,而且零形代词、代词以及全称名词短语有时可以互换使用。 不同的语言具有不同的下指中心集排序方法,且决定排序的因素在向心文献中还没有完全确定。基于Chao(1968)所提出的话题(topic)和Li Thompson(1979)的话题显著性(topic-prominence)以及Chen(1984)的可及性排序(Accessibility Hierarchy),本研究制定出汉语下指中心排序方法。为验证此方法的可行性,本研究进行了语料实证,结果证明此方法是有效可行的。此外,本研究还探讨了促使实体突显的其他因素,如存现结构以及高意图性(highintentionality)和控制(control)的介入。 为进一步提高此排序方法的全面性,本研究还就如何对复合名词短语进行排序进行了探讨。基于Tetreault(2001)的观点以及Walker and Prince(1995)、Gordonet al.(1999)和Hobbs(1978)的方法,本研究提出汉语中复合名词短语的排序方法。此方法较为折中,因而较适用于汉语语篇中对复合名词短语的有效排序。 由于过渡类型的计算对于本研究,尤其是零形回指的生成至关重要,本研究对其进行了较为深入的探讨。通过结合Laurel Fais(2004)的定义和Strube andHahn(1999)的分类方法,本研究设定了18种过渡类型。这些过渡类型在分类上更为细致,且在推理努力上能保持高度的一致性,更为重要的是,它们可以有效处理为可推导下指中心设定过渡类型的问题。此外,这些过渡类型还可用于进一步提高本研究所提出的零形回指解析算法和生成算法的有效性。 本研究提高了向心理论的语篇处理能力,扩大了它的应用范围。希望本研究能促进人们对语篇回指的更进一步理解,并有助于汉语自然语言的计算机处理。
【学位授予单位】:复旦大学
【学位级别】:博士
【学位授予年份】:2006
【分类号】:H15

【引证文献】
中国博士学位论文全文数据库 前1条
1 邱明波;动词的指向对汉语第三人称代词和反身代词的句内回指的制约[D];复旦大学;2011年
【参考文献】
中国期刊全文数据库 前10条
1 宋柔;计算机辅助汉语校对系统[J];当代语言学;2001年01期
2 苗兴伟;语篇向心理论述评[J];当代语言学;2003年02期
3 熊学亮,许宁云;逆证与语法化[J];暨南大学华文学院学报;2005年02期
4 许宁云,韩丹;非常规间接前指照应的释义策略[J];外语学刊;2005年02期
5 许宁云;前指形式选择中的认知互动分析[J];外语教学;2004年04期
6 胡壮麟;有关语篇衔接理论多层次模式的思考[J];外国语(上海外国语大学学报);1996年01期
7 王德亮;汉语零形回指解析——基于向心理论的研究[J];现代外语;2004年04期
8 王桂珍;主题、主位与汉语句子主题的英译[J];现代外语;1996年04期
9 石定栩;汉语主题句的特性[J];现代外语;1998年02期
10 石毓智;汉语的主语与话题之辨[J];语言研究;2001年02期
【共引文献】
中国期刊全文数据库 前10条
1 喻家楼;语篇中显性连贯、隐性连贯与译作的语义传递[J];安徽农业大学学报(社会科学版);2002年05期
2 李春芳;;What is poverty的语篇连贯机制的解读[J];安徽工业大学学报(社会科学版);2011年06期
3 李春芳;;英汉消息类新闻语篇词汇衔接手段的对比研究——以CNN和CCTV为例[J];安徽文学(下半月);2011年08期
4 吴利琴;;语篇衔接理论在高级英语教学中的应用[J];安徽科技学院学报;2008年06期
5 王静;;英汉学术文章主位结构中及物性对比分析[J];鞍山师范学院学报;2006年05期
6 蒋燕;主述结构与翻译[J];安顺师范高等专科学校学报;2002年02期
7 于建凯;;英汉语主题的结构与功能[J];安阳师范学院学报;2009年03期
8 王晓伟;;语篇结构分析的回眸与前瞻[J];安阳工学院学报;2011年03期
9 黄家红;汉语话题主位与英语主语主位间的互译[J];毕节师范高等专科学校学报(综合版);2003年04期
10 张晶;;从量词使用看英汉数量表达之异同[J];宝鸡文理学院学报(社会科学版);2006年05期
中国重要会议论文全文数据库 前7条
1 谭学纯;;辞格生成与理解:语义·语篇·结构[A];福建省辞书学会第五届会员代表大会暨第十九届年会论文集[C];2009年
2 刘禀诚;;主谓式标题的语法特征[A];江西省语言学会2004年年会论文集[C];2004年
3 戴光荣;;英汉语篇语音衔接对比分析[A];中国英汉语比较研究会第七次全国学术研讨会论文集[C];2006年
4 罗智勇;宋柔;;相似词及其在计算机辅助校对系统中的应用[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
5 许小星;亢世勇;;基于标注语料库的主谓谓语句的语义分析[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
6 王德亮;;语篇连贯性的量化测量——基于向心理论的研究[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
7 张伟男;张宇;刘挺;;基于中心理论的中文对话省略恢复研究[A];第六届全国信息检索学术会议论文集[C];2010年
中国博士学位论文全文数据库 前10条
1 张喜荣;英汉叙述语篇参与者标识手段对比研究[D];上海外国语大学;2010年
2 韩巍峰;主题与主题标记结构的语序类型学研究[D];上海外国语大学;2010年
3 李秉震;汉语话题标记的语义、语用功能研究[D];南开大学;2010年
4 彭吉军;《论语》话题结构研究[D];华中科技大学;2011年
5 林新宇;汉语和韩国语话题句对比研究[D];中央民族大学;2011年
6 陈静;语用认知视角下的指称研究[D];浙江大学;2010年
7 潘珣祎;现代汉语话题结构的认知语用研究[D];浙江大学;2010年
8 杨一飞;语篇中的连接手段[D];复旦大学;2011年
9 邱明波;动词的指向对汉语第三人称代词和反身代词的句内回指的制约[D];复旦大学;2011年
10 姚堯;《春秋公羊传》词彙、语法专题研究[D];复旦大学;2010年
中国硕士学位论文全文数据库 前10条
1 隆娟;抒情诗隐性衔接研究[D];长沙理工大学;2010年
2 方艳;英汉第三人称照应对比研究[D];长沙理工大学;2010年
3 鲁燕燕;衔接理论在英汉科技语篇翻译中的应用[D];江西师范大学;2010年
4 艾小艳;英汉左移位构式的认知研究[D];江西师范大学;2010年
5 郭翠萍;语篇分析理论在初中英语阅读教学中的运用[D];山东师范大学;2010年
6 张胡彬;人际意义衔接对比研究[D];长春工业大学;2010年
7 汪红英;论让步连接成分“固然”[D];南昌大学;2010年
8 周迎霞;现代汉语篇章中的推论连接成分研究[D];南昌大学;2010年
9 邹梅;英语专业学生议论文语篇分析[D];华东理工大学;2011年
10 陈思秋;高中阅读理解讲评方式及效果[D];福建师范大学;2009年
【同被引文献】
中国期刊全文数据库 前10条
1 李劲荣;从认知图式看两种表领属关系的主谓句[J];安庆师范学院学报(社会科学版);2004年05期
2 王媛;;从“方向”的角度对现代汉语单音节动作动词分类[J];安阳工学院学报;2006年01期
3 沈阳;领属范畴及领属性名词短语的句法作用[J];北京大学学报(哲学社会科学版);1995年05期
4 李瑟;刘伟;郭海云;;汉语第三人称代词预指功能研究[J];北京交通大学学报(社会科学版);2005年04期
5 青松;唐昌平;;汉语“自己”所指的优选论分析[J];重庆工学院学报(社会科学版);2008年08期
6 闻礼华,刘辉修;约束理论A原则对汉语解释的局限性[J];长沙铁道学院学报(社会科学版);2002年03期
7 尹世香;俄语中的定向动词与不定向动词[J];辽宁财专学报;2004年03期
8 程工;生成语法对汉语“自己”一词的研究[J];国外语言学;1994年01期
9 程工;汉语“自己”一词的性质[J];当代语言学;1999年02期
10 秦洪武;第三人称代词在深层回指中的应用分析[J];当代语言学;2001年01期
中国博士学位论文全文数据库 前4条
1 徐阳春;关于虚词“的”及其相关问题研究[D];复旦大学;2003年
2 翁依琴;汉语零形回指的认知研究[D];复旦大学;2006年
3 梁鲁晋;语篇中回指的功能[D];厦门大学;2007年
4 杨宁;汉语零形回指消解的心理语言学研究[D];广东外语外贸大学;2008年
中国硕士学位论文全文数据库 前1条
1 蔡淑美;现代汉语特殊与格结构“V+X+的+O”格式研究[D];北京语言大学;2008年
【二级引证文献】
中国博士学位论文全文数据库 前1条
1 杜翠河;汉语“在”字句与越南语“(?)”字句对比研究[D];复旦大学;2012年
【二级参考文献】
中国期刊全文数据库 前7条
1 沈家煊;转指和转喻[J];当代语言学;1999年01期
2 苗兴伟;语篇向心理论述评[J];当代语言学;2003年02期
3 尹邦彦;英语零照应的类型与主要特征[J];解放军外国语学院学报;1999年02期
4 ;计算机辅助汉语校对系统[J];科技与出版;1995年06期
5 DEIRDRE WILSON;RELEVANCE, WORD MEANING AND COMMUNICATION: THE PAST, PRESENT AND FUTURE OF LEXICAL PRAGMATICS[J];现代外语;2004年01期
6 袁毓林;;话题化及相关的语法过程[J];中国语文;1996年04期
7 ;商务印书馆今年计划出版的哲学译著[J];哲学研究;1959年02期
【相似文献】
中国期刊全文数据库 前10条
1 王德亮;汉语零形回指解析——基于向心理论的研究[J];现代外语;2004年04期
2 许余龙;段嫚娟;付相君;;“语句”与“代词”的设定对指代消解的影响——一项向心理论参数化实证研究[J];现代外语;2008年02期
3 许余龙;;向心理论的参数化研究[J];当代语言学;2008年03期
4 许宁云;;关于向心理论中过渡类型问题的探讨[J];学术界;2010年02期
5 洪明;;向心局部连贯模式的发展及其仍需解决的问题[J];浙江师范大学学报(社会科学版);2011年01期
6 段嫚娟;许余龙;付相君;;前瞻中心的排序对指代消解的影响——一项向心理论参数化实证研究[J];外国语(上海外国语大学学报);2009年03期
7 洪明;;向心理论的发展与应用研究[J];学术界;2011年04期
8 王德亮;;汉语回指消解算法推导[J];外语教学;2011年03期
9 洪明;;向心理论在英语写作连贯性量化评价中的应用——一项基于中国英语专业大学生英语作文语料库的实证研究[J];外语电化教学;2011年03期
10 李丛禾;;语篇向心理论在回指解析中的运用[J];外国语言文学;2007年01期
中国重要会议论文全文数据库 前10条
1 姚文荣;姚华;;基于解析余度技术的涡轴发动机传感器故障诊断[A];中国航空学会第七届动力年会论文摘要集[C];2010年
2 王德亮;;语篇连贯性的量化测量——基于向心理论的研究[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
3 范守文;徐礼钜;;一种新型并联机床的动力学解析模型[A];第十三届全国机构学学术研讨会论文集[C];2002年
4 杨金福;陈策;张文琴;董春伟;王永军;袁平;;浮环厚度对轴承环速比及稳定性影响的机理研究[A];2009年全国青年摩擦学学术会议论文集[C];2009年
5 赵永利;;风沙运动的一种解析模型[A];第十二届全国结构工程学术会议论文集第Ⅰ册[C];2003年
6 赵宗清;丁永坤;郝轶聃;袁永腾;李志超;;中子半影成像的软件系统[A];第十三届全国等离子体科学技术会议论文集[C];2007年
7 戴锋;吴松涛;刘靖旭;李天河;;经济发展力的蓄积与释放:方式,模型与实证[A];第十一届中国管理科学学术年会论文集[C];2009年
8 郑东;;同轴度坐标测量误差分析与测量方案的正确选择[A];江苏省计量测试学术论文集(2010)[C];2010年
9 吴俊云;;过渡空调环境中人体热舒适性瞬变解析模型[A];制冷空调新技术进展——第四届全国制冷空调新技术研讨会论文集[C];2006年
10 焦慧芳;陈新军;张晓松;;CMOS电路瞬态电流测试及其解析模型研究[A];第一届中国微电子计量与测试技术研讨会论文集[C];2008年
中国重要报纸全文数据库 前3条
1 本版编辑 唐克旺 中国水利水电科学研究院水资源所 教授级高级工程师 陈家军 本报记者 汪栋;科学评估地下水系统的模拟技术[N];中国水利报;2006年
2 章立品;从“文科大学生扎堆补数学”想到的[N];解放军报;2005年
3 建国;UOE钢管强度各向异性对抗压强度的影响及其预测方法[N];世界金属导报;2006年
中国博士学位论文全文数据库 前10条
1 许宁云;汉语篇章零回指的解析与生成:一项基于语料的向心研究[D];复旦大学;2006年
2 康熙;星系形成的半解析模型[D];中国科学院研究生院(上海天文台);2004年
3 孙珊珊;向心理论的参数设定及其在英汉指代消解中的应用研究[D];上海外国语大学;2011年
4 田录林;永磁轴承和导轨磁力解析模型的研究[D];西安理工大学;2008年
5 洪明;向心理论的局部连贯模式与二语写作质量评价[D];上海外国语大学;2009年
6 张志明;汽轮机启动过程中安全经济优化的研究[D];华北电力大学(北京);2006年
7 王永军;拉弯精确成形智能控制技术研究[D];西北工业大学;2005年
8 张宪霞;空间分布动态系统的3-D模糊控制设计与分析[D];上海交通大学;2008年
9 沈洪;激光弯曲成形的精度控制研究[D];上海交通大学;2007年
10 郑善合;火力发电机组汽轮机高温部件变形及蠕变寿命的研究[D];华北电力大学(北京);2008年
中国硕士学位论文全文数据库 前10条
1 刘向明;基于模型的故障诊断方法的应用研究[D];哈尔滨工程大学;2004年
2 姜剑生;非对称射流形成研究[D];中国工程物理研究院北京研究生部;2002年
3 吕雪峰;基于遗传算法的电力系统故障诊断[D];大庆石油学院;2006年
4 刘同;扇形分裂漏磁敏场效应晶体管相对灵敏度研究[D];浙江大学;2007年
5 陆伟;轴向磁场无槽永磁同步电机的电磁场分析[D];华中科技大学;2007年
6 张鹞;刚性桩复合地基—筏板基础—上部结构共同作用性状研究[D];重庆大学;2008年
7 邓转志;典型滑动轴承油膜力解析模型的对比分析及试验研究[D];华北电力大学(北京);2009年
8 路川藤;长江口潮波传播[D];南京水利科学研究院;2009年
9 王晓玉;小世界网络上疾病传播及控制的解析方法研究[D];华中科技大学;2007年
10 张爱玲;Delta算子系统故障检测[D];郑州大学;2007年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026