收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于博客语料库副词使用的性别差异实证研究

李二涛  
【摘要】:本文以语料库语言学为理论指导,以国家语言资源监测与研究中心大规模博客语料库为真实数据来源,以实际语料中语言现象的出现概率为依据,针对博客中使用的副词进行统计分析,最终以探寻男女性别人群语言差异为研究目的。通过对总体副词、各次类副词、高低频副词、语义韵以及重叠副词等五个方面的精准统计、详细观察和充分描写,归纳、概括了现代汉语副词在这五个方面所表现出来的共性和差异,并从社会语言学的角度对其形成原因进行了简明扼要的阐释。事实上,研究视角上的开创性丰富和发展了汉语副词的系统研究;研究方法上的实证性使副词研究更具科学性和准确性。 我们依托计算机强大的索引、分词、标注、统计、计算等功能,针对大规模博客语料库中的男女副词进行了较为系统性的研究,在研究方法和手段方面也进行了尝试性的探索,为自然语言处理开辟了新的途径,为汉语语法教学、对外汉语教学、中文信息处理等方面提供语言运用的可靠信息和理论依据,为国内外语言专家学者提供相关学术性参考数据,也为国家语言政策、语言规划部门进行语言监测、制定国家语言标准提供真实语言数据。 除了绪论的第一章和关于语料库中副词的归类和判定的第二章外,本文内容大体分为六个部分: 第三章基于大规模博客语料库针对男女博客总体副词性别差异与共性进行了对比研究,发现共性大于差异。首先对国内外副词性别差异研究进行了述评,然后从男女博客总体副词、各次类副词、累加覆盖率与词种数关系、文本数与分布率、词长分布以及男女博客共用副词和独用副词等方面进行了研究。男性副词和女性副词的总数以及三大类中各总数相差不大,具有较强一致性。男性和女性副词各次类所占的比例一致:限制性副词描摹性副词评注性副词。男性、女性副词累加覆盖率趋势曲线图具有较强的相似性,男女副词在博客真实文本中都具有一种规律极强的分布情况。男性副词根据频率排序与分布率排序总体较为相似,仅有个别副词的排序有所变动。由于该博客语料库规模庞大,所以分布统计法和频率统计法统计的结果大致相当,没有达到统计意义上的显著水平。女性比男性使用副词的频次平均值多11628,女性在博客中使用副词的总体频次是男性的1.83倍,女性使用副词的频率远高于男性,这说明女性比男性更倾向于使用副词。随着男女副词词长的增加,平均频次却呈下降趋势。我们还发现女性副词的平均频次均比男性高,单字词高出的幅度最大,双字词其次,三字词的幅度更小,四字词的幅度最小。男性和女性副词共983个和985个,其中共用副词961个,各自的非共用副词分别有22个和24个。男性倾向于使用与政治、工作、游戏等相关的内容,副词选用也较为正式;女性则倾向于使用与感情、心理等相关的副词。 第四章对男女博客各次类副词的性别差异与共性进行了研究,发现共性与差异并存。该章以网络博客语料库中真实的数据为研究对象,对男女博客副词的各次类进行频次、频率、累计频率、累加覆盖率等方面进行统计分析,从而找出博客中不同性别对于副词各次类的不同使用规律,最终试图找出男女博客中的使用异同。在限制性副词的数量上,男性和女性大致相当。其中,各个次类的数量也大致相当。但女性使用时间副词、范围副词和程度副词数量都比男性偏多,男性使用关联副词、否定副词和协同副词数量都比女性偏多,频率副词和重复副词的数量等同。从各次类的数量上看,男性描摹性副词个数比女性多,其中,表方式、表状态和表情状的副词都比女性多,女性表比况的描摹性副词比男性多2个,但差异并未达到统计上的显著水平。在描摹性副词的使用中,女性更倾向于使用表比况的描摹性副词;而男性更倾向于使用表示方式、状态和情状的描摹性副词。女性比男性更倾向于使用评注性副词。女性使用副词“太”、“还是”、“真”、“一定”、“真是”的频率明显大于男性,而男性使用“当然”的频率明显大于女性,说明这些评注性副词均是高频词,但也存在着一定的性别差异。 第五章针对不同性别高频出现和低频出现的副词展开深入研究,试图客观、真实地探寻它们使用的不同规律。研究发现高低频副词方面差异大于共性。男性由高到低排序前152位副词为高频副词,占所有男性副词词种数的15.46%;女性由高到低排序前90位副词为高频副词,占所有女性副词词种数的9.14%,说明女性高频副词的平均频率更高。根据男女累加覆盖率与副词词种数递增趋势曲线图可知,女性累加覆盖率在90%之前,坡度更大,递增速度更快,词种数较少;相反,男性累加覆盖率在90%之前,上扬的坡度相对较小,递增速度较缓慢,词种数较多。从词长的角度来看,单字词的平均频次最高,男性和女性的平均频次分别达454825和879442;双字词的平均频次次之,男性和女性平均频次分别达104109和38322:三字词的平均频次更低,男性和女性平均频次分别达59335和22818;四字词均为0。随着词长的增加,平均频次却相反呈下降趋势。男性高频副词平均频次是男性副词平均频次的5.8倍,女性高频副词平均频次是女性副词平均频次的9.4倍,悬殊之大,也足以说明高频副词的频率之高。最后,对男性和女性中的否定副词进行了统计,发现男性和女性均有29个否定副词。男性使用频率较高的否定副词的总体数量高于女性,说明男性在博客中否定表达的需要较多,与否定副词的使用频率偏高有直接关系。 第六章对博客语料库中副词语义韵的性别差异进行了研究,发现以共性为主。本章基于数据和基于数据驱动的方法对“严重XX”的普遍性和局部性语义韵进行了较为系统的研究。研究发现,网络男女博客中不仅存在着由典型搭配构成的普遍性语义韵,而且还存在由异常搭配构成的局部性语义韵。与此同时,男性和女性之间也存在着细微的区别。语言使用者故意违背语言使用因循性,造成语义韵冲突,最终实现网络中特有、诙谐的表达效果。基于统计数据发现“严重+VP”、“严重+NP”和“严重+AP”三个类联接。其中,“严重+VP”类联接有205例,全部作状语,占全部有效频次的64.3%;“严重+NP”类联接有107例,全部作修饰语,占全部有效频次的33.5%;“严重+AP”类联接有7例,全部作状语,占全部有效频次的2.2%。基于统计数据,在319个实例中,3.8%(12/319)的搭配属于中性,其余96.2%(307/319)的搭配都是消极词汇,所构成的语义氛围都是消极语义,导致其右侧的语境是消极语义韵。我们认为“严重”具有极其明显的消极语义韵结构。 同时,我们也注意到“严重”的词类在三个类联接中有两个词类。在“严重+VP”和“严重+NP”类联接中“严重”均是形容词词性,分别修饰VP和NP,而在“严重+AP”类联接中“严重”应该是副词词性,相当于“非常”或“极其”。众所周知,纯状语性是副词的本质、区别性特征。其次,我们基于数据驱动的方法,计算出MI≥3的有效右侧搭配词共57个。其中,98.2%的搭配词具有消极的语义氛围,建立“严重”的语义韵结构。以上两种常规方法的研究表明:当距位为“N+l”时,“严重”的普遍性语义韵律具有明显的消极语义韵,搭配词在语境中营造了消极语义氛围。另外,我们对大规模博客语料库中男性和女性“严重”的局部性语义韵律进行了研究。在现实交际过程中,说话人可能故意违反搭配和谐的原则,选用不寻常的搭配在语义上构成冲突,形成积极、正面的语义氛围,最终造成语义韵冲突,并利用语义韵冲突实现特殊的交际效果。统计表明,在大规模博客语料库中已出现“严重”的异常搭配,频率极低,但已构成其积极局部性语义韵律。在男性博客语料中只发现了4个异常搭配,分别是“严重有感觉”、“严重地激励”、“严重清醒”和“严重感谢”;在女性博客语料中只发现了1个异常搭配,即“严重感谢”。 第七章利用大规模博客语料库对重叠副词进行准确的统计研究,重点考察了汉语中重叠副词男女使用的差异。男性重叠副词词种数为65个,占男性副词总种数的6.61%,女性为64个占女性副词总种数的6.5%;其中60个为共用重叠副词;男性独用重叠副词的个数为5个,占男性重叠副词总数的7.69%,女性独用重叠副词的个数为4个,占女性重叠副词总数的6.25%。男性的独用重叠副词更倾向于客观、动作等的描述,副词选用也较为正式,如“迟迟”、“缓缓”、“轻轻”等;而女性则倾向于使用与感情、内心等相关的副词,如“独独”、“牢牢”、“默默”、“时时处处”等重叠副词。其次,我们将根据外在形式将副词重叠分为完全重叠和部分重叠。完全重叠的研究表明:单音节重叠AA式中,女性副词的使用频率普遍比男性高,这与女性更倾向于使用偶数(逢双)音节的习惯有直接关系;双音节重叠AABB式中,男性和女性重叠副词分别有3个和4个,分别占重叠副词总数的3%和6%。部分重叠结构是在双音节AB的基础上,重叠为AAB式,只重叠词根,不重叠后缀,构成“AA然”。在男性和女性博客语料库中,男性和女性均只有一个“AA然”结构,即“悠悠然”,男性使用频次和频率均低于女性。再次,从重叠的内在结构角度,重叠式副词可分为有基式重叠副词和无基式重叠副词。作者分别对男性和女性中的有基式重叠和无基式重叠副词进行了详细的对比研究,结果发现:各种重叠式副词的词种数男女多少不一,女性使用频率普遍比男性偏高。最后,从语用的角度进行了对比,结果发现重叠式副词有两个相反的作用:一是使程度更深,语气更重,频率更快,二是使程度更浅,语气更轻,频率更低。 第八章是结语,指出本文在博客语料库中男女副词研究方面所进行的探索、不足以及后续可以开展的研究。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 秦平新;;“宣传”一词的语义韵、理解与翻译——一项基于语料库的调查[J];新疆大学学报(哲学人文社会科学版);2009年03期
2 余小梅;陈光明;;华裔美国作家哈金作品《落地》建构的中国形象——基于语料库的考察[J];乐山师范学院学报;2019年11期
3 赵秋荣;肖忠华;;基于语料库的翻译研究:现状与展望——第四届“基于语料库的语言对比与翻译研究”国际学术研讨会综述[J];中国翻译;2015年02期
4 王克非;;语料库翻译学——新研究范式[J];中国外语;2006年03期
5 陆蒙娜;;《语言、语料库、认知》述评[J];海外英语;2017年17期
6 支永碧;张慧敏;支冉;;基于语料库的《年度中国军力报告》语义韵分析[J];苏州科技学院学报(社会科学版);2015年06期
7 张莹;;《语料库的使用与翻译:运用语料库学习翻译和运用语料库进行翻译》评介[J];中国外语;2011年06期
8 薛雪;;基于语料库的语义韵研究与双语词典编纂[J];赤峰学院学报(汉文哲学社会科学版);2010年02期
9 隋荣谊;;翻译研究中的语料库[J];英语知识;2009年08期
10 侯奕茜;刘玉梅;;国际语料库翻译研究的新进展——《实证翻译研究:方法和理论传统再创新》介评[J];外国语文;2020年01期
11 濮建忠;;语料库与语言一元化研究[J];解放军外国语学院学报;2010年02期
12 王大鹏;;国内语料库发展现存问题与分析[J];渤海大学学报(哲学社会科学版);2010年03期
13 G.Thompson;S.Hunston;赵莉;;《系统与语料库——探究其联系》简介[J];当代语言学;2009年02期
14 张耀中;孙宇涵;史磊;;语料库在俄语教学中的应用探究[J];科技风;2020年08期
15 闫锐;;语料库语言学下的语言研究解读[J];语文建设;2016年17期
16 徐李荣;;《网络语料库:理论与实践》评介[J];哈尔滨师范大学社会科学学报;2015年01期
17 杨阳;;《基于语料库的语法研究》评介[J];南昌师范学院学报;2019年05期
18 周莹;;言者顺应:基于语料库驱动视角[J];广东石油化工学院学报;2020年02期
19 张绵;;基于语料库的词汇特征分析——以《爱玛》为例[J];安徽文学(下半月);2013年04期
20 邵斌;;网络语料库:英语研究的方便之门——《运用网络语料库探索英语》述评[J];当代外语研究;2011年11期
中国重要会议论文全文数据库 前20条
1 刘克强;;基于语料库的新闻越南语特征分析[A];外语教育与翻译发展创新研究(第四卷)[C];2015年
2 赵丹;;基于语料库的口译教学研究[A];第十四届全国科技翻译研讨会论文汇编[C];2011年
3 武光军;;语料库翻译学的范式理据与范式体系[A];中国英汉语比较研究会第八次全国学术研讨会论文摘要汇编[C];2008年
4 马玄思;郭曙纶;;基于语料库的“接近”和“靠近”辨析[A];《国际汉语学报》第6卷第2辑[C];2016年
5 陈瑛;李逸薇;黄居仁;;非监督的汉语感情语料库的构建及分析[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
6 才让加;头旦才让;周毛先;;藏语语料库加工方法研究[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年
7 肖健;袁琦;宋金平;;使用三元组可比语料库改进和发展机器翻译系统[A];第十四届全国科技翻译研讨会论文汇编[C];2011年
8 贺琳;吕士楠;冯勇强;初敏;钱瑶;;汉语合成语料库的韵律层级标注研究[A];新世纪的现代语音学——第五届全国现代语音学学术会议论文集[C];2001年
9 曲清琳;;关于例证语料库的一点想法[A];2004年辞书与数字化研讨会论文集[C];2004年
10 李晓静;;谈语料库系统中已有辞书库的建设及面临的问题[A];2004年辞书与数字化研讨会论文集[C];2004年
11 谢家成;;自建语料库、网上语料库与英语教学与学习[A];全国大学英语教学改革暨网络环境下外语教学学术研讨会论文集[C];2004年
12 杨节之;;网络语料库与课堂英语教学[A];全国大学英语教学改革暨网络环境下外语教学学术研讨会论文集[C];2004年
13 安娜;刘海涛;侯敏;;语料库中熟语的标记问题[A];第三届全国语言文字应用学术研讨会论文集[C];2004年
14 刘金凤;亢世勇;;基于标注语料库的情景语义成分分析[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
15 满正行;高璐;;藏语单语料库分析及标注探讨[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年
16 李艳娇;杨尔弘;;基于动态流通语料库的连词考察[A];第五届全国青年计算语言学研讨会论文集[C];2010年
17 刘开瑛;由丽萍;;基于语料库的汉语辞书编纂系统[A];2004年辞书与数字化研讨会论文集[C];2004年
18 安娜;侯敏;;语料库中的插入语标注研究[A];第三届学生计算语言学研讨会论文集[C];2006年
19 曾燕秋;;当学习型词典不够用的时候:一项在线语料库与学习型词典的个案对比研究[A];首届海峡两岸外语教学与研究学术研讨会暨福建省外国语文学会2011年会论文集[C];2011年
20 王桂琼;;基于语料库的对外汉语语法项目教学——以疑问代词“什么”为例[A];2019对外汉语博士生论坛暨第十二届对外汉语教学研究生学术论坛论文集[C];2019年
中国博士学位论文全文数据库 前20条
1 李二涛;基于博客语料库副词使用的性别差异实证研究[D];华中师范大学;2012年
2 恩和巴雅尔;蒙古国新闻语料库的构建及相关问题研究[D];内蒙古大学;2016年
3 何清顺;基于语料库的英语独立主格结构之系统功能语言学研究[D];西南大学;2013年
4 冯聪;基于中英电影语料库比较的英语电影翻译研究[D];华东师范大学;2020年
5 王俭;基于语料库的海明威小说评论研究[D];上海外国语大学;2012年
6 于洋;基于语料库的环境话语中的联合研究[D];山东大学;2013年
7 周小玲;基于语料库的译者文体研究[D];湖南师范大学;2011年
8 吴金星;蒙古语语料库加工集成平台的构建[D];内蒙古大学;2015年
9 刘建鹏;语料库支撑的系统功能语法研究[D];西南大学;2012年
10 李毅;基于语料库的隐喻普遍性与变异性研究[D];山东大学;2012年
11 李斌;用ELAN自建汉语方言多媒体语料库及其应用研究[D];湖南师范大学;2013年
12 谢学敏;基于动态流通语料库(DCC)的流行语释义信息自动提取研究[D];北京语言大学;2006年
13 郑泽芝;基于动态流通语料库(DCC)的汉语字母词语识别及考察研究[D];北京语言大学;2005年
14 方秀才;基于语料库的中国英语学习者动词“非限定小句”词汇语法特征研究[D];上海外国语大学;2014年
15 孟勐;基于语料库的中国作者和英语母语作者英文学术论文中评价语言的对比研究[D];上海外国语大学;2007年
16 李安兴;双语语料库与汉英词典词目翻译质量的进一步提高[D];复旦大学;2005年
17 王强军;基于动态流通语料库(DCC)的信息技术领域新术语自动提取研究[D];北京语言文化大学;2003年
18 赵小兵;基于动态流通语料库的现代汉语基本词汇自动识别与提取方法研究[D];北京语言大学;2007年
19 孙启高;基于语料库的公文缩略语知识挖掘研究[D];山东大学;2014年
20 陈令君;英语学术书评中的评价:一项基于语料库的研究[D];山东大学;2008年
中国硕士学位论文全文数据库 前20条
1 张伟;基于语料库的量词“对、双、副”研究[D];华中师范大学;2017年
2 原灵杰;从建构主义的角度论基于语料库的翻译教学[D];广东外语外贸大学;2009年
3 王海平;英汉平行翻译语料库的构建原则与应用研究[D];西安工程大学;2012年
4 高莉;硬新闻语料库的创建和应用[D];山东大学;2011年
5 陈安文;基于布朗语料库的《喧哗与骚动》语言特色研究[D];济南大学;2013年
6 万朔;面向语料库的微博情感分析研究[D];南京航空航天大学;2020年
7 郑婧婧;蔬菜种植信息语料库构建方法的分析与设计[D];河北科技师范学院;2017年
8 田霞;和画语料库的设计与实现[D];西北大学;2017年
9 赵晨潇;地书语料库的设计与实现[D];西北大学;2017年
10 王竹青;基于语料库的韩国学生离合词“帮忙”偏误考察[D];湖南大学;2016年
11 陈婷;基于语料库的航海英语关键词搭配研究[D];大连海事大学;2016年
12 李萍;自建小型语料库在辅助译员培训中的应用研究[D];山东师范大学;2015年
13 栗娜;语料库驱动的英语写作中连接副词的使用分析[D];西北民族大学;2013年
14 卢璐;基于语料库的中美英语新闻中模糊限制语对比分析[D];安徽大学;2012年
15 钱之莹;汉英/英汉平行翻译语料库的设计及其在翻译中的应用[D];华东师范大学;2005年
16 杨进;基于语料库的英汉空间词对比研究[D];安徽大学;2006年
17 尤丽红;基于语料库的中美媒体关于在欧洲的难民的报道的批评话语分析[D];重庆大学;2017年
18 李昆华;高职高专英语应用能力考试计算机语料库建设[D];云南师范大学;2007年
19 付涛;托马斯·哈代“性格与环境”小说特点的语料库文体学研究[D];天津科技大学;2015年
20 王思慧;语料库在英语口语教学实践中的应用研究[D];陕西师范大学;2015年
中国重要报纸全文数据库 前20条
1 北京外国语大学北京日本学研究中心 段文晶;以学习者为中心建设语料库[N];中国社会科学报;2019年
2 戴光荣 福建工程学院人文学院;从语料库视角看中国文学作品“走出去”[N];中国社会科学报;2018年
3 国家社科基金重大项目“大规模英汉平行语料库的建立与加工”首席专家、北京外国语大学教授 王克非;构建新型的历时复合语料库[N];中国社会科学报;2016年
4 记者 郝日虹;我国首个质量安全语料库建成[N];中国社会科学报;2014年
5 商报记者 罗添 实习记者 张绪旺;输入法语料库进入“T”时代[N];北京商报;2010年
6 杨希贵 王东;合作开发语料库还仅仅是第一步[N];中国图书商报;2005年
7 本报记者 朱颖婕;人类的1%比AI的99%更重要[N];文汇报;2019年
8 黑龙江大学应用外语学院 关秀娟;语料库推进莎剧汉译研究[N];中国社会科学报;2016年
9 受访者 迈克尔·麦卡锡(《剑桥标准英语教程》首席作者、国际著名语言学家) 采访者 王东(商报记者);语料库技术用于英语教学是全球趋势[N];中国图书商报;2011年
10 殷治纲;语音语料库的建设和作用[N];中国社会科学院院报;2006年
11 记者 王坤宁;商务方正合作开发辞书语料库及编纂系统[N];中国新闻出版报;2002年
12 安徽商贸职业技术学院外语系 李金霞;语料库对商科院校外宣材料作用研究[N];山西青年报;2014年
13 李行健;现代汉语规范词典拒收“屌丝白富美”因品位太低(下)[N];语言文字周报;2014年
14 本报记者 张贵勇;语料库:英语学习的技术突破[N];中国教育报;2011年
15 施晨露;大部头与小图标[N];解放日报;2019年
16 本报记者 周建华;数字战略打造核心竞争力[N];中国图书商报;2001年
17 本报记者 王斯敏 通讯员 吴青;不惧险远 勇开新天[N];光明日报;2013年
18 通讯员 咸俞灵;迫切需要建设完备的汉语中介语语料库[N];科技日报;2012年
19 记者 及庆玲;“蒙古语语料库”建设取得重大成果[N];内蒙古日报(汉);2014年
20 记者 陈诚;我市国内首建“语联网”产业园[N];长江日报;2012年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978