收藏本站
《南京师范大学》 2006年
收藏 | 手机打开
二维码
手机客户端打开本文

现代汉语实词语法功能考察及词类体系重构

徐艳华  
【摘要】:随着信息社会对信息自动化处理要求的不断提高,越来越需要计算机能对自然语言进行深层分析,比如文本校对、机器翻译、自动文摘等等,这就要求我们为计算机提供尽可能多的语言知识尤其是语法知识,使其能够进行正确的分析进而做到真正的“理解”。现有的汉语语法体系,可以说已经研究得比较深入了,但其主要是面向人的,面对计算机这个新的交际伙伴,其研究成果还是显得有些粗糙。因此,要真正实现信息自动化处理,必须加大汉语语法研究的力度,加细语法刻画的颗粒度,构建真正适合计算机处理自然语言需要的汉语词类体系。本文正是在这样的服务宗旨下展开研究的。 本文研究主要从如下三个方面展开: 1.以语料库为信息源,采用统计并辅以内省的方法,详细考察了名词、动词、形容词和副词中高频的3514个词的语法功能,构建了语法功能信息库,并以信息库中统计的数据为依据,彻底贯彻“按照词的语法功能划分词类的标准”,依据“句法功能完全相同即为一类”的原则,对3514个常用词进行了分类,最终分出676类,其中,一词一类的有364类,两词一类的有107类,两词以上同类的有205类,对于一词一类和两词一类的,我们放到词典里描述,剩下的205类就是新实词词类体系所包含的类别。 2.从句法功能复杂度和分类结果两个方面对现有的词类体系和我们构建的词类体系进行了对比研究。研究结果表明,只有10.1%的词在两种体系中的句法功能复杂度是相同的,而有84.1%的词在旧体系中的句法功能复杂度是高于新体系的。这说明现有的词类体系夸大了汉语中词的多功能现象,归属同一类别的词,不管是有1项功能还是具有10项功能都给以相同的标记显然有失偏颇,不能客观地反映汉语的实际情况。另外,从分类结果看,新体系中存在一个词类包含旧体系中多个词类的情况,这说明旧体系通过找“特点”来为词归类的做法不可取,必须在详细考察的基础上才能做到“词有定类”。 3.从清华大学100万字的汉语句法树库中提取了11,206个V+V序列和10,081个v+n序列进行了考察。前一种序列匹配后只有一种句法关系的有2679种组合模式共10,296个实例,正确率分别为82.9%和91.9%。后一种序列匹配后只有一种句法关系的有1462种组合模式共7189个实例,正确率分别为70.7%和71.3%。其他有两种以上句法关系的模板,尽管不能确定具体实例中究竟是哪种关系,但相对于旧体系来说,其歧义的数量大大减少了。统计结果表明,新体系在外显式歧义结构的消解和基本名词短语的识别方面都起到了很好的作用。
【学位授予单位】:

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 陈小荷!100083;从自动句法分析角度看汉语词类问题[J];语言教学与研究;1999年03期
2 徐艳华;;动词再分类对句法分析的作用[J];山西财经大学学报;2011年S2期
3 周刚;叶秋生;;属性词语法性质的再认识[J];汉语学习;2007年06期
4 高松;颜伟;刘海涛;;基于树库的现代汉语动词句法功能的计量研究[J];汉语学习;2010年05期
5 刀洁;;傣语多项定语的体词向心结构[J];语言科学;2006年04期
6 邹晓玲;;邵阳方言中的“Ab(哩)”式形容词[J];韶关学院学报;2011年05期
7 陈练军;;论“壁”的语素化[J];语言科学;2010年04期
8 蔡旭;;事物形容词在定语和状语位置上的语义分析[J];盐城师范学院学报(人文社会科学版);2007年03期
9 赵永刚;;英语动词短语和短语动词的句法学分析[J];郑州航空工业管理学院学报(社会科学版);2007年06期
10 杨梅;刘冬青;;《红楼梦》中“极”类程度副词计量考察[J];萍乡高等专科学校学报;2009年04期
11 邓文彬;试从句法成分的性质看句法分析[J];殷都学刊;1988年01期
12 胡明扬;;现代汉语词类问题考察[J];中国语文;1995年05期
13 倪宝元;;关于《成语例示》[J];杭州大学学报(哲学社会科学版);1983年02期
14 李国南;英汉拟声词句法功能比较[J];外语教学与研究;1999年04期
15 廉亚健;; 独立结构及其惯用句法功能[J];英语自学;2002年08期
16 曾海清;现代汉语“V+到”结构句法平面简析[J];九江学院学报(社会科学版);2005年02期
17 王群力;;“索性”的历时考察:功能演变及语义分化[J];辽宁大学学报(哲学社会科学版);2006年03期
18 徐君善;;江苏邳州话中的程度副词“直搁”[J];现代语文(语言研究版);2008年10期
19 钟应春;;数量短语使用情况考察[J];牡丹江大学学报;2008年10期
20 谢茹;;论比况短语[J];语文学刊;2008年21期
中国重要会议论文全文数据库 前10条
1 徐艳华;李斌;;信息处理用名词细分类研究[A];第二届全国学生计算语言学研讨会论文集[C];2004年
2 徐艳华;陈小荷;李斌;陈钟;;面向自动句法分析的现代汉语“V+V”结构歧义研究[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
3 斯·劳格劳;华沙宝;萨如拉;;基于统计方法的蒙古语依存句法分析模型[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
4 周俏丽;蔡东风;张桂平;季铎;林晓庆;;基于最大熵的“vp np的np”句法结构排歧[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
5 陈鑫;车万翔;刘挺;;基于主动学习的中文依存句法分析[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
6 陈劲光;何婷婷;李芳;桂卓民;;基于概率和句法分析的中文句子修剪[A];第五届全国青年计算语言学研讨会论文集[C];2010年
7 王丹;姬东鸿;黄玮;;一种基于MIRA和遗传算法的句法分析模型构造方法[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
8 才藏太;;基于规则的汉藏机器翻译系统中二分法的句法分析方法研究[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年
9 张晓甜;赵海;;基于树结构模式挖掘的非监督中文短语结构句法分析[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
10 赵铁军;李生;孟遥;黄玉;杨沐昀;;机器翻译系统中句法分析技术的研究实践[A];辉煌二十年——中国中文信息学会二十周年学术会议论文集[C];2001年
中国重要报纸全文数据库 前10条
1 水月子;智能打造电子图书馆[N];电脑报;2001年
2 中国科学院计算技术研究所 王 斌;内容为王[N];计算机世界;2004年
3 王宝琳;谈动词名物化在新闻中的运用[N];中华新闻报;2007年
4 肖忠华;郎读、朗诵中停连的运用(上)[N];语言文字周报;2008年
5 李琨;IBM百度共拓企业搜索[N];中国计算机报;2006年
6 记者 潘竑;企业搜索:激活被遗忘的信息财富[N];金融时报;2006年
7 程胜清;刑诉法中“讯问”一词的误用[N];检察日报;2008年
8 执笔 江荻;人文社会科学前沿扫描[N];中国社会科学院院报;2008年
9 邵敬敏;“过犹不及”——多余与残缺[N];语言文字周报;2011年
10 汪蔚;IBM 倡导端到端的无线电子商务[N];中国计算机报;2003年
中国博士学位论文全文数据库 前10条
1 徐艳华;现代汉语实词语法功能考察及词类体系重构[D];南京师范大学;2006年
2 姚文琳;汉语依存句法分析方法的研究与实现[D];中国海洋大学;2009年
3 杨潇;基于生成性概率模型的句法分析和多文档自动文摘研究[D];山东大学;2009年
4 斯·劳格劳;现代蒙古语依存句法自动分析研究[D];内蒙古大学;2011年
5 李军辉;中文句法语义分析及其联合学习机制研究[D];苏州大学;2010年
6 王晶;现代汉语实词句法功能的不对称研究[D];苏州大学;2008年
7 杨春雷;HPSG理论中“自己”和量化名词短语的语用解释的约束条件体系[D];上海外国语大学;2008年
8 尹洪波;否定词与副词共现的句法语义研究[D];中国社会科学院研究生院;2008年
9 乔翔;汉英形修名结构对比研究[D];中央民族大学;2011年
10 唐秀玲;论话题及其在汉语语法分析中的应用[D];上海师范大学;1997年
中国硕士学位论文全文数据库 前10条
1 顾芸;名词短语移位的句法分析[D];南京师范大学;2006年
2 余加柱;同形词语法功能消歧[D];南京师范大学;2008年
3 谌金中;“多/少+N”结构多角度考察[D];湖南师范大学;2006年
4 崔善熙;鸠摩罗什译《维摩诘所说经》与敦煌本《维摩诘经讲经文》的‘之’字偏正结构用法比较研究[D];山东大学;2005年
5 周俏丽;面向汉语单句的依存句法分析研究[D];沈阳航空工业学院;2006年
6 李曙光;POSS-ING结构的句法分析[D];南京师范大学;2002年
7 皮晓峰;基于概率上下文无关语法的句法分析研究与实现[D];电子科技大学;2005年
8 刘琍;“程度副词+名词”的语义、语用和句法分析[D];四川师范大学;2005年
9 金天;论汉语及英语中否定歧义的消除[D];广东外语外贸大学;2007年
10 尹鹏;基于SVM的中文组块间依存关系分析[D];大连理工大学;2006年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978