收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于语料库的现代汉语准口语计量研究

吕艳辉  
【摘要】:本文以现代汉语口语与书面语的“过渡状态”——准口语为研究对象,在大规模真实语料的支持下,在对准口语与书面语以及不同类型的准口语之间进行对比分析的基础上,对现代汉语准口语的用字、用词情况和特点作了尽量详尽的动态描写和计量分析,并试图在此基础上探索现代汉语书面语、口语的自动文体判断规则与方法。全文共分五章: 第一章 概论 本章首先概述了准口语的概念和性质、意义与研究方法。在对口语和书面语进行了系统区分的基础上,对本文的研究对象——准口语——进行了定义,即不同于完全自然口语的、带有人为加工痕迹的口语。准口语不同于书面语,也不同于完全自然状态下的口语,有独特的研究价值和意义。目前口语研究多为经验性的研究,本文主张在以往经验性研究的基础上,利用大规模语料库结合基于规则的方法,对准口语进行定量与定性分析,从语料库中发现问题,用语料库所提供的数据分析问题。 第二章 现代汉语准口语语料库的设计与建立 本章简述了建立现代汉语准口语语料库的目的、语料选取原则、语料类型与结构、语料库自动分词与标注的基本情况。本章在考察和借鉴了目前已有的现代汉语口语语料库的基础上,提出了“准口语语料库”的概念,并对服务于本研究的550万字的现代汉语准口语语料库的建立、加工过程和情况做了介绍。 第三章 现代汉语准口语的字频分析 由于汉字与汉语音节的对应性,考察汉字的情况,实际上反映了口语中音节的使用情况。从这些高频字作为最常用的单音节词使用来看,其中代词的比例很大。从音节结构来看,高频字的音节总体上比较简单。最高频字“的”的频率随准口语类型逐渐接近日常自然口语而逐渐降低。准口语总用字数在2000左右,六种准口语类型中出现1—2次的最低频字平均为589字,占总字种数的近30%。 第四章 现代汉语准口语的词频分析 不同准口语类型的人名、地名、商标、机构名、数字、英文字符等具有不同的使用情况和特点。准口语中后缀的使用较少,且切分错误较多。六种类型的准口语前20位高频词的累积覆盖率平均为27.71%,高频词多为单音节词。只出现1—4次的低频词数占总词条数的比例平均高达68.39%。由高频词的高覆盖率及低频词的高词种数,我们得出了准口语用词比较简单的结论。 第五章 准口语特征与讨论 重叠形式词语、“子”后缀词、“说”系列词等从形式、内容、功能等方面体现了口语特色。后缀“们”的不同使用情况体现了各种准口语类型的口语化程度的不同。口语词也是准口语用词特色之一,应依靠口语词词库来进行判断。 结语 结语部分对本研究加以总体概括,并指出了研究中存在的不足之处,同时提出了进一步研究的设想。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 崔刚,盛永梅;语料库中语料的标注[J];清华大学学报(哲学社会科学版);2000年01期
2 朱乐红;利用语料库研究不确定频度词[J];天津外国语学院学报;2002年03期
3 李颖;使用语料库索引学习英语近义词探讨[J];黄河水利职业技术学院学报;2003年02期
4 李明;语料库·蓝本·双语词典[J];苏州大学学报(哲学社会科学版);2003年03期
5 黄橙紫;科技英语词汇的统计特征[J];同济大学学报(社会科学版);2003年02期
6 娄宝翠;英语常用词搭配使用的对比:以health为例[J];外语与外语教学;2004年07期
7 张欣韵;通过语料库对外语课堂交流进行的调查[J];重庆三峡学院学报;2004年04期
8 齐建晓;;基于语料库的英语形容词后置定语分析[J];平原大学学报;2005年06期
9 毛凤凡;周嫚;;论语料库在EFL教学中的应用[J];广西广播电视大学学报;2006年02期
10 卢明添;;语料库在词汇研究中被忽视的问题[J];三明学院学报;2006年03期
11 陈彦梅;;再论语料库与英语词汇教学[J];佳木斯大学社会科学学报;2006年06期
12 焦彬凯;;英语语料库对我国英语教学的启示[J];许昌学院学报;2006年06期
13 马永腾;;基于语料库的《红楼梦》中“V个VP”结构分析[J];现代语文(语言研究版);2007年02期
14 孙咏梅;吴松林;;旅游语料库模糊搜索翻译等效[J];科技资讯;2007年08期
15 陈彦梅;;语料库与英语词汇教学[J];长春师范学院学报(人文社会科学版);2007年03期
16 穆惠峰;;基于语料库的词汇教学研究与英语词汇教学[J];宿州教育学院学报;2007年02期
17 李睿;;基于语料库的数据驱动学习在外语教学中的前景[J];甘肃教育;2007年14期
18 焦彬凯;;语料库驱动的英语词汇学习模式研究[J];教育探索;2007年09期
19 赵玉闪;史娟;;浅谈语料库在翻译教学中的应用[J];中国电力教育;2007年10期
20 董芳;蒙景村;罗刚;;水族水书语料库的建立原则研究[J];黔南民族师范学院学报;2007年06期
中国重要会议论文全文数据库 前10条
1 郭曙纶;;基于语料库的HSK多功能例解字典:设想与样例[A];2004年辞书与数字化研讨会论文集[C];2004年
2 梁红梅;尹晓霞;李宇庄;;有关语料库驱动下的外语在线自主学习的工作底稿[A];全国大学英语教学改革暨网络环境下外语教学学术研讨会论文集[C];2004年
3 许小星;亢世勇;孙茂松;刘金凤;;语料库语义成分标注的若干问题[A];第三届学生计算语言学研讨会论文集[C];2006年
4 宋鸿彦;刘军;姚天昉;刘全升;黄高辉;;汉语意见型主观性文本标注语料库的构建[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
5 黄玉;李生;孟遥;丁华福;;基于大规模语料库的英语从句识别[A];第一届学生计算语言学研讨会论文集[C];2002年
6 李明;;语料库·蓝本·双语词典[A];中国辞书学会双语词典专业委员会第五届年会暨学术研讨会论文集[C];2003年
7 郭启新;;论语料库与英汉词典配例[A];中国辞书学会双语词典专业委员会第四届年会暨学术研讨会论文集[C];2001年
8 蔡莲红;蔡锐;吴志勇;陶建华;;语音合成语料库的设计与声学特征分析[A];中国声学学会2002年全国声学学术会议论文集[C];2002年
9 孙述学;;新词语语料库建设的一些构想[A];2004年辞书与数字化研讨会论文集[C];2004年
10 王仁华;胡郁;李威;凌震华;;基于决策树的汉语大语料库合成系统[A];第六届全国人机语音通讯学术会议论文集[C];2001年
中国博士学位论文全文数据库 前10条
1 于洋;基于语料库的环境话语中的联合研究[D];山东大学;2013年
2 张廷香;基于语料库的3-6岁汉语儿童词汇研究[D];山东大学;2010年
3 夏云;基于语料库的英汉翻译小说常规化研究:历时的视角[D];山东大学;2010年
4 刘建鹏;语料库支撑的系统功能语法研究[D];西南大学;2012年
5 李斌;用ELAN自建汉语方言多媒体语料库及其应用研究[D];湖南师范大学;2013年
6 何婷婷;语料库研究[D];华中师范大学;2003年
7 李毅;基于语料库的隐喻普遍性与变异性研究[D];山东大学;2012年
8 赵永青;基于语料库的英语多人冲突性话语研究[D];上海外国语大学;2012年
9 王青;基于语料库的《尤利西斯》汉译本译者风格研究[D];山东大学;2010年
10 唐斌;《人民日报》中(1987-2007)农民工的话语再现[D];上海外国语大学;2010年
中国硕士学位论文全文数据库 前10条
1 吕艳辉;基于语料库的现代汉语准口语计量研究[D];山东大学;2005年
2 宋沁潞;金庸小说语言研究[D];山东大学;2008年
3 岳炳词;面向语言学研究的大规模汉语生语料库检索工具CCRLT[D];北京工业大学;2001年
4 徐琰;基于语料库的ONLY研究[D];大连海事大学;2003年
5 杨丽萍;基于语料库的英语专业大学生议论文限时写作中的四字词块研究[D];江西师范大学;2010年
6 李淼;用先进的语料库工具推进英语教学[D];首都师范大学;2004年
7 李春青;[D];电子科技大学;2004年
8 王蓉;新闻英语的批评性语篇分析[D];上海师范大学;2010年
9 刘鼎甲;连接成分的显化:基于语料库的中英文翻译文本对比[D];燕山大学;2010年
10 刘露露;汉语衍名的双事件隐喻分析[D];四川外语学院;2011年
中国重要报纸全文数据库 前10条
1 本报记者 周建华;数字战略打造核心竞争力[N];中国图书商报;2001年
2 记者 王坤宁;商务方正合作开发辞书语料库及编纂系统[N];中国新闻出版报;2002年
3 卢伟;文学语言的语料库研究方法[N];文艺报;2004年
4 记者 赵勇;安徽省政府工作报告“税”字频现[N];中国税务报;2010年
5 记者 曹秀娟;省社科院两项目获得国家社会科学基金[N];山西日报;2010年
6 顾曰国;语料库语言学的发展[N];中国社会科学院院报;2003年
7 陈劲宏;东方快车2003之新鲜体验[N];中国电脑教育报;2002年
8 李大庆;迎来光与电告别铅与火[N];科技日报;2002年
9 ;探索普通话自然连续语音之规律[N];光明日报;2001年
10 本报记者 陈友梅;让电脑说人话[N];中国计算机报;2001年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978