收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

语料库支撑的系统功能语法研究

刘建鹏  
【摘要】:语料库支撑的系统功能语法研究是一个新的语言学研究视角,它的核心是在系统功能语法理论框架下实现语料库中生语料的半自动化和自动化句法检索、标注。在语料库支撑的系统功能语法研究中,理论研究与探索是建立在对自然发生语料的检索、标注、统计和分析基础之上,这使得系统功能语法研究更具有可验证性和客观性。另外,大规模语料支撑使得理论研究具有可验证性,经过标注的语料具有理论驱动性。系统功能语法理论之部分语言学信息的半自动化和自动化的语料检索、标注的实现,使得进行大规模语料标注成为可能,系统功能语法研究由此更深入、系统。 语料库支撑的系统功能语法研究的主要依据是系统功能语法与语料库语言学的理论兼容性和互补性。语料库语言学的学科属性属于哲学上的经验主义,认同功能语言学,二者的思想与方法源于弗斯(Firth)的语言学理论。二者共同的经验哲学观都把语言视为一种社会现象,以语言使用、自然语篇为基础来研究语言的规律和特点,都认同意义即语言的社会使用。不仅如此,二者也都认同语言的概率本质,语料库的介入使得语言的形式、意义、功能和语境之间建立起一定的定量关系,语料库支撑的系统功能语法研究是通过对语料库的检索和分析来建立语言系统或语言现象的概率模型。 目前,国内的语料库研究和系统功能研究是分开的,系统功能语法主要是纯理论推导,也有基于单个或多个语篇分析,但很难说是语料库介入的研究。在国外,语料库和系统功能语法相结合的研究较多,分为基于语料库的系统功能语法研究和语料库驱动的系统功能语法研究,但这两种方法都未能恰当地将语料库植入系统功能语法研究之中。基于语料库的系统功能语法研究的理论色彩过于浓重,语料基本由人工标注,语料处理能力非常有限,语料库仅仅被用于简单地抽取支撑理论的例示,不具有语料验证性和理论驱动性,且语料缺乏规模性、客观性和代表性。语料库驱动的方法几乎完全放弃现有的系统功能语法理论研究成果,而单纯依靠语言‘直觉和非常有限的理论来观察分析语料和研究语言现象,因此这一研究方法使得语料库驱动研究难免有些肤浅并缺乏系统性。 语料库支撑的系统功能语法研究从以上两种研究方法的核心问题——语料句法标注的自动化或半自动化检索、标注和处理入手,使系统功能语法研究真正成为一种可验证的、客观性的、系统的理论探索研究。句法标注和检索自动化的关键是标注项和检索项可被自动化处理,从句法入手的自动化标注被理论和实践证明是行不通的,这就需要从语料自动化处理的词汇倾向性出发,试图达到部分句法标注和检索的目的。这种处理方式的关键是建立一种模型,其中包括两个方面:一是尽可能的将系统功能语法中有关元功能的句法意义模型化为可供自动标注和检索的模式;二是将能够自动处理的词汇项模型化为一定的模式,这种模式既要保证自动化处理,又要尽可能多地包含元功能句法意义。简言之,这一模型中理论尽可能具体化,语料尽可能抽象化。模型化的特性决定了自动化的标注和检索不能处理所有的元功能意义,因为有些元功能意义抽象化程度很高,它很难被模型化为可供自动处理的形式,即很难被自然语料接触到。 自动化和半自动化的语料处理,具体到操作上,是要通过以下措施来实现系统功能语法的部分理论的标注问题。从词汇倾向入手的语料句法标注和检索分为三个部分:首先是在系统功能语法理论框架下,建立小句成分线性共现的语法概率模型:二是概念元功能的部分语言学信息的半自动化和自动化句法检索、标注和处理;三是语篇元功能的衔接系统理论模型化及其检索。从词汇倾向入手的语料句法标注和检索,始于小句成分线性共现研究。语法可表征为词汇纵向选择网络,词汇研究是词类系统的纵向选择即线性共现的研究。线性共现把节点词的功能具体化,建立一个词类系统选择的概率模型,把词语使用规约性量化为一定的使用功能概率模型,它是有效探讨句法成分概率及句法跨语篇概率的基础和前提。 语料库支撑的系统功能语法研究中,概念元功能的部分句法赋码应从词汇构建体验为图型的系统概率选择开始,从词汇倾向性入手来解决小句句法赋码的基本思路如下:首先,要设定研究层面的具体内容,如对元功能的研究;其次,要具体化各个研究问题到词汇上,把各个元功能的特点形式化为词汇形式或正则表达式的检索询问项,然后通过检索询问项的方式对生语料检索,并对检索到的语料进行人工筛选;最后,对经过筛选并符合元功能特点的语料进行自动赋码。这种自动赋码加人工筛选的半自动生语料赋码方法,克服了手工赋码费时耗力的缺点,它具体分为以下七个步骤:1)使用软件进行语篇词汇频率列表;2)根据研究的不同方面对词汇列表中的词汇进行检索和标记归类;3)使用根据系统功能语法设计的软件导入文件;4)根据要研究的方面和系统功能语法调整和设计赋码框架;5)导入标记框架;6)根据语言特征编辑检索询问项并对检索到的所有小句进行筛选,去除不符合语言特征的小句,如果检索例外结果显示检索设置未对某些语言现象或单词频率列表中的检索词加以定义,先定义检索项和检索词;7)对符合语言特征条件的小句进行自动赋码,然后手工筛选不能赋码的项目或重新定义相关特征。系统功能语法的概念元功能意义上的句法赋码的理论模型化,本质上是理论被词汇化为可供检索的模式,这种模式化是部分概念元功能意义上的模型化,而并非所有概念元功能意义,全部意义模型化会使研究完全局限于一个系统框架,其研究结构势必对语料分析有先见之嫌。再者,由于完全标注费时费力,导致语料库规模小且研究缺乏客观性。 语料库支撑的系统功能语法研究,关于部分语篇元功能的理论模型化与概念元功能略有不同。语篇元功能的衔接系统模型化,即衔接系统被表征为可检索的词型和正则表达式。它的理论模型化具体是建立有关不同衔接意义的语篇词汇集,然后把这些代表不同衔接意义的同义或反义、上下义或部分整体词汇集制作成检索列表,并以检索列表项为检索词或序列对语篇进行检索,这一模型化主要分三步:1)确定衔接系统的研究问题;2)根据研究问题,通过列举上下义成员关系建立上下义或其它关系词汇集;3)根据词汇集建立检索列表,如有必要,可建立与之相关附属语境词集。最后,对不同衔接意义词汇集的检索的相对频率关系进行分析、比较和推理,从而得出有关衔接系统的概率模型。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 何常丽;;语料库语言学研究综述[J];复旦外国语言文学论丛;2008年01期
2 何常丽;;语料库语言学研究综述[J];渤海大学学报(哲学社会科学版);2009年03期
3 宋京生;;基于语料库的英语存在句研究[J];江苏科技大学学报(社会科学版);2006年02期
4 崔艳嫣;黄瑞红;;语料库语言学研究方法之哲学思考[J];云南师范大学学报(对外汉语教学与研究版);2010年04期
5 王立非;陈功;;大学生英语写作中的名物化现象研究[J];中国外语;2008年05期
6 王英;;基于语料库的英语学术写作实验教学研究[J];西南农业大学学报(社会科学版);2010年04期
7 崔刚,盛永梅;语料库中语料的标注[J];清华大学学报(哲学社会科学版);2000年01期
8 朱乐红;利用语料库研究不确定频度词[J];天津外国语学院学报;2002年03期
9 李颖;使用语料库索引学习英语近义词探讨[J];黄河水利职业技术学院学报;2003年02期
10 李明;语料库·蓝本·双语词典[J];苏州大学学报(哲学社会科学版);2003年03期
11 黄橙紫;科技英语词汇的统计特征[J];同济大学学报(社会科学版);2003年02期
12 娄宝翠;英语常用词搭配使用的对比:以health为例[J];外语与外语教学;2004年07期
13 张欣韵;通过语料库对外语课堂交流进行的调查[J];重庆三峡学院学报;2004年04期
14 齐建晓;;基于语料库的英语形容词后置定语分析[J];平原大学学报;2005年06期
15 毛凤凡;周嫚;;论语料库在EFL教学中的应用[J];广西广播电视大学学报;2006年02期
16 卢明添;;语料库在词汇研究中被忽视的问题[J];三明学院学报;2006年03期
17 陈彦梅;;再论语料库与英语词汇教学[J];佳木斯大学社会科学学报;2006年06期
18 焦彬凯;;英语语料库对我国英语教学的启示[J];许昌学院学报;2006年06期
19 马永腾;;基于语料库的《红楼梦》中“V个VP”结构分析[J];现代语文(语言研究版);2007年02期
20 孙咏梅;吴松林;;旅游语料库模糊搜索翻译等效[J];科技资讯;2007年08期
中国重要会议论文全文数据库 前10条
1 郭曙纶;;基于语料库的HSK多功能例解字典:设想与样例[A];2004年辞书与数字化研讨会论文集[C];2004年
2 梁红梅;尹晓霞;李宇庄;;有关语料库驱动下的外语在线自主学习的工作底稿[A];全国大学英语教学改革暨网络环境下外语教学学术研讨会论文集[C];2004年
3 许小星;亢世勇;孙茂松;刘金凤;;语料库语义成分标注的若干问题[A];第三届学生计算语言学研讨会论文集[C];2006年
4 宋鸿彦;刘军;姚天昉;刘全升;黄高辉;;汉语意见型主观性文本标注语料库的构建[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
5 黄玉;李生;孟遥;丁华福;;基于大规模语料库的英语从句识别[A];第一届学生计算语言学研讨会论文集[C];2002年
6 李明;;语料库·蓝本·双语词典[A];中国辞书学会双语词典专业委员会第五届年会暨学术研讨会论文集[C];2003年
7 郭启新;;论语料库与英汉词典配例[A];中国辞书学会双语词典专业委员会第四届年会暨学术研讨会论文集[C];2001年
8 蔡莲红;蔡锐;吴志勇;陶建华;;语音合成语料库的设计与声学特征分析[A];中国声学学会2002年全国声学学术会议论文集[C];2002年
9 孙述学;;新词语语料库建设的一些构想[A];2004年辞书与数字化研讨会论文集[C];2004年
10 王仁华;胡郁;李威;凌震华;;基于决策树的汉语大语料库合成系统[A];第六届全国人机语音通讯学术会议论文集[C];2001年
中国博士学位论文全文数据库 前10条
1 刘建鹏;语料库支撑的系统功能语法研究[D];西南大学;2012年
2 张廷香;基于语料库的3-6岁汉语儿童词汇研究[D];山东大学;2010年
3 夏云;基于语料库的英汉翻译小说常规化研究:历时的视角[D];山东大学;2010年
4 何婷婷;语料库研究[D];华中师范大学;2003年
5 杨石乔;基于语料库的汉语医患会话修正研究[D];上海外国语大学;2010年
6 徐欣;基于语料库的英汉小说语篇中话语标记功能研究[D];山东大学;2011年
7 李毅;基于语料库的隐喻普遍性与变异性研究[D];山东大学;2012年
8 赵永青;基于语料库的英语多人冲突性话语研究[D];上海外国语大学;2012年
9 王青;基于语料库的《尤利西斯》汉译本译者风格研究[D];山东大学;2010年
10 曲英梅;基于语料库的英汉动名化对比研究[D];东北师范大学;2009年
中国硕士学位论文全文数据库 前10条
1 岳炳词;面向语言学研究的大规模汉语生语料库检索工具CCRLT[D];北京工业大学;2001年
2 徐琰;基于语料库的ONLY研究[D];大连海事大学;2003年
3 杨丽萍;基于语料库的英语专业大学生议论文限时写作中的四字词块研究[D];江西师范大学;2010年
4 李淼;用先进的语料库工具推进英语教学[D];首都师范大学;2004年
5 李春青;[D];电子科技大学;2004年
6 王蓉;新闻英语的批评性语篇分析[D];上海师范大学;2010年
7 刘鼎甲;连接成分的显化:基于语料库的中英文翻译文本对比[D];燕山大学;2010年
8 刘露露;汉语衍名的双事件隐喻分析[D];四川外语学院;2011年
9 李慧;基于语料库的海商法英语情态研究[D];大连海事大学;2011年
10 黄洁;基于语料库的商务英语词汇特点的研究[D];大连海事大学;2010年
中国重要报纸全文数据库 前10条
1 记者 王坤宁;商务方正合作开发辞书语料库及编纂系统[N];中国新闻出版报;2002年
2 本报记者 周建华;数字战略打造核心竞争力[N];中国图书商报;2001年
3 卢伟;文学语言的语料库研究方法[N];文艺报;2004年
4 记者 曹秀娟;省社科院两项目获得国家社会科学基金[N];山西日报;2010年
5 顾曰国;语料库语言学的发展[N];中国社会科学院院报;2003年
6 陈劲宏;东方快车2003之新鲜体验[N];中国电脑教育报;2002年
7 李大庆;迎来光与电告别铅与火[N];科技日报;2002年
8 ;探索普通话自然连续语音之规律[N];光明日报;2001年
9 本报记者 陈友梅;让电脑说人话[N];中国计算机报;2001年
10 闫宏志;全文翻译技术发展脉络[N];中国计算机报;2003年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978