收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

现代汉语实词语法功能考察及词类体系重构

徐艳华  
【摘要】:随着信息社会对信息自动化处理要求的不断提高,越来越需要计算机能对自然语言进行深层分析,比如文本校对、机器翻译、自动文摘等等,这就要求我们为计算机提供尽可能多的语言知识尤其是语法知识,使其能够进行正确的分析进而做到真正的“理解”。现有的汉语语法体系,可以说已经研究得比较深入了,但其主要是面向人的,面对计算机这个新的交际伙伴,其研究成果还是显得有些粗糙。因此,要真正实现信息自动化处理,必须加大汉语语法研究的力度,加细语法刻画的颗粒度,构建真正适合计算机处理自然语言需要的汉语词类体系。本文正是在这样的服务宗旨下展开研究的。 本文研究主要从如下三个方面展开: 1.以语料库为信息源,采用统计并辅以内省的方法,详细考察了名词、动词、形容词和副词中高频的3514个词的语法功能,构建了语法功能信息库,并以信息库中统计的数据为依据,彻底贯彻“按照词的语法功能划分词类的标准”,依据“句法功能完全相同即为一类”的原则,对3514个常用词进行了分类,最终分出676类,其中,一词一类的有364类,两词一类的有107类,两词以上同类的有205类,对于一词一类和两词一类的,我们放到词典里描述,剩下的205类就是新实词词类体系所包含的类别。 2.从句法功能复杂度和分类结果两个方面对现有的词类体系和我们构建的词类体系进行了对比研究。研究结果表明,只有10.1%的词在两种体系中的句法功能复杂度是相同的,而有84.1%的词在旧体系中的句法功能复杂度是高于新体系的。这说明现有的词类体系夸大了汉语中词的多功能现象,归属同一类别的词,不管是有1项功能还是具有10项功能都给以相同的标记显然有失偏颇,不能客观地反映汉语的实际情况。另外,从分类结果看,新体系中存在一个词类包含旧体系中多个词类的情况,这说明旧体系通过找“特点”来为词归类的做法不可取,必须在详细考察的基础上才能做到“词有定类”。 3.从清华大学100万字的汉语句法树库中提取了11,206个V+V序列和10,081个v+n序列进行了考察。前一种序列匹配后只有一种句法关系的有2679种组合模式共10,296个实例,正确率分别为82.9%和91.9%。后一种序列匹配后只有一种句法关系的有1462种组合模式共7189个实例,正确率分别为70.7%和71.3%。其他有两种以上句法关系的模板,尽管不能确定具体实例中究竟是哪种关系,但相对于旧体系来说,其歧义的数量大大减少了。统计结果表明,新体系在外显式歧义结构的消解和基本名词短语的识别方面都起到了很好的作用。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 颜文婕;;汉语词类划分问题研究[J];魅力中国;2010年01期
2 卢仲逖;英语词类划分溯源[J];湖北函授大学学报;2002年04期
3 史冠新;;现代汉语语气词界说[J];山东社会科学;2008年10期
4 吴新民;顾超美;杨战胜;;词类范畴研究述评[J];吉林省教育学院学报;2008年11期
5 吕志;古代汉语教材词类划分分歧现象探讨[J];荆州师范学院学报;2002年04期
6 吕莹凯;词类划分在语法教学中的作用[J];语文学刊;2005年09期
7 高航;;认知语法视角下的汉语兼类问题考察[J];汉语学习;2009年02期
8 黄明亮;;原型范畴理论与汉语词类划分初论[J];语文学刊;2009年17期
9 刘卫宁;;象声词词类问题再探[J];社会科学论坛(学术研究卷);2007年11期
10 李丹丹;;《助字辨略》虚字再分类[J];绥化学院学报;2009年06期
11 张艳杰;俄语词类划分原则的层级性及其系统[J];外语学刊;1998年03期
12 任翠菊;;浅析汉英词汇对比[J];科技信息(学术版);2006年04期
13 袁毓林;;对“词类是表述功能类”的质疑[J];汉语学报;2006年03期
14 张海涛;;不同理论指导下的汉语词类划分标准[J];语言与翻译;2007年04期
15 仲崇山;;汉语词类划分的功能标准述评[J];韩山师范学院学报;2007年05期
16 向梅;;胡、黄、张三套《现代汉语》教材词类划分标准的比较[J];青年文学家;2011年11期
17 成善祯;传统词类划分的弊端[J];江苏大学学报(高教研究版);1988年03期
18 马萍;张松;;从《语言学纲要》与《语言学引论》的对比看语言学的发展[J];理论界;2006年S2期
19 熊作余;;认知范畴与汉语词类评议[J];齐齐哈尔师范高等专科学校学报;2009年06期
20 袁毓林;;现代汉语虚词模糊划分的隶属度量表[J];汉语学报;2005年04期
中国重要会议论文全文数据库 前10条
1 ;关于汉语词类系统历史演变的思考·提纲[A];高名凯先生学术思想研讨会——纪念高名凯先生诞辰100周年论文集[C];2011年
2 柳明月;;谈原型范畴理论中对词类划分的问题——对“受人以鱼,不如授人以渔”的英译文中“fish”词性问题的讨论[A];第四届全国认知语言学研讨会论文摘要汇编[C];2006年
3 郭文燕;;区别词新探[A];江西省语言学会第五届会员大会暨2002年学术年会论文集[C];2002年
4 扎西加;多拉;大罗桑朗杰;欧珠;;《信息处理用藏文词类及标记集规范》的理论说明[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年
5 多拉;扎西加;欧珠;大罗桑朗杰;;信息处理用藏文词类及标记集规范(征求意见稿)[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年
6 杨正超;;现代汉语时量词研究概述[A];2007年福建省辞书学会第18届年会论文提要集[C];2007年
7 陈保亚;;词和词组的分布特征分析——纪念高名凯先生诞辰100周年[A];高名凯先生学术思想研讨会——纪念高名凯先生诞辰100周年论文集[C];2011年
8 张亚军;;语用功能词及其词类归属问题[A];2006年江苏省哲学社会科学界学术大会论文集(下)[C];2006年
9 靳光瑾;肖航;富丽;;信息处理用现代汉语词类标记规范(修订)[A];第四届全国语言文字应用学术研讨会论文集[C];2005年
10 张泉宝;;《汉英大辞典》的宏观结构与微观设计[A];第二届全国双语词典学术研讨会暨福建省辞书学会第九届年会论文集[C];1996年
中国博士学位论文全文数据库 前10条
1 崔惠玲;韩国语词类学的历时研究[D];复旦大学;2011年
2 吴晓芳;张斌语法思想研究[D];福建师范大学;2009年
3 李春风;邦朵拉祜语参考语法[D];中央民族大学;2012年
4 夏全胜;汉语名词、动词和动名兼类词语义加工的ERP研究[D];南开大学;2012年
5 徐阳春;关于虚词“的”及其相关问题研究[D];复旦大学;2003年
6 马晓红;陈望道对中国语法修辞研究的历史贡献[D];复旦大学;2005年
7 吴怀成;现代汉语动词指称化的层级分布及其类型学思考[D];上海师范大学;2012年
8 赵金灿;云南鹤庆白语研究[D];中央民族大学;2010年
9 步连增;语言类型学视野下的汉语量词研究[D];山东大学;2011年
10 王美雨;车王府藏子弟书方言词语及满语词研究[D];山东大学;2012年
中国硕士学位论文全文数据库 前10条
1 许红花;HSK甲级词中的兼类词研究[D];延边大学;2004年
2 梁玥;有关汉日形容词句法方面的比较研究[D];大连外国语学院;2008年
3 袁伟;现代汉语词典标注词性之比较与批评[D];苏州大学;2006年
4 林莉;“广义形态”说在汉语语法史上的地位和作用[D];新疆大学;2008年
5 邝立宾;皆川秀孝《清语会话》(《シソゴカイワ》)研究[D];上海师范大学;2012年
6 王雨玮;词类直接转换的认知研究[D];湖南大学;2013年
7 许艳辉;现代汉语名词的形容词用法研究[D];四川大学;2006年
8 李秀梅;马礼逊《通用汉言之法》研究[D];山东师范大学;2013年
9 丘雅;《说苑》实词转类研究[D];广西师范大学;2008年
10 刘名彰;《新著国语文法》与《汉语语法学》比较研究[D];湖南师范大学;2009年
中国重要报纸全文数据库 前1条
1 记者 晓白 实习记者 何馨;继承发扬《现汉》精神 永葆原创性辞书精品本色[N];中国社会科学院院报;2005年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978