收藏本站
《北京语言大学》 2008年
收藏 | 手机打开
二维码
手机客户端打开本文

汉语中介语偏误的计算机处理方法研究

王洁  
【摘要】:本文的研究目标是让计算机辅助人来处理汉语中介语中的偏误。辅助的方式有四种:偏误的自动识别及提示;偏误的交互式识别及提示;偏误的自动标注;偏误标注的自动管理和检索。其中自动识别及提示的智能性最高,是本文研究的重点,其处理过程首先是自动发现偏误,在发现的基础上,计算机还可以进一步在不同程度上给出提示:直接修改、给出修改建议、指出偏误原因或提出疑问。目前,有关计算机查错的研究领域中,只有英语拼写检查技术比较成熟,汉语字词错误的校对系统刚刚达到具有实用价值的水平,其他方面的应用技术还在研究过程中,汉语中介语偏误的计算机处理还没有见到有相关研究成果发表。 本文的工作集中在以下三方面: 第一,面向计算机进行了偏误分析的理论研究。分析了计算机的长处和局限性,结合HSK动态作文语料库的偏误标注体系以及《外国人学汉语语法偏误分析》中的偏误类别体系,根据计算机处理自然语言的能力及所需知识,对各类偏误自动识别及提示的可行性进行了分析,特别指出语法偏误自动识别及提示的可行性较强,提出了计算机进行偏误处理的指导思想。 第二,进行了偏误自动识别及提示的实践研究。依据出错率较高、可形式化程度较高等标准,选择了“把”字句、“比”字句、“有”字句和“被”字句四种特殊句型偏误作为切入点,采用规则的方法进行了偏误自动识别及提示的实验,通过与人工标注的结果相比较,证实了计算机能够在这些特殊句型偏误的识别和提示方面发挥很好的辅助作用。 第三,进行了偏误自动标注的实践研究。利用了经典的求解字符串间编辑距离的算法,以汉语的词为单位通过进一步求解仿人的编辑路径发现修正原句所需要的基本编辑操作,从而实现了原句和修正句的自动比对。此外,基于自动比对的结果还让计算机在一定程度上参与偏误的归类。这样,能够较好地弥补偏误人工标注的缺陷,体现了人机的优势互补。 与以往的一些相关研究比较起来,本文工作的创新性体现在: (1)研究侧重点 在汉语的偏误分析方面,以往的研究是面向人的,目的是寻找让学生减少、避免偏误的教学策略;本文的研究是面向计算机的,目的是寻找让计算机自动或半自动地识别、修正偏误的方法。 在汉语的中介语语料库建设方面,以往的工作主要是人工标注偏误;本文的研究是探讨如何让计算机尽可能地参与其中,与人形成优势互补。 在中文文本查错方面,以往的研究针对的是汉语母语写作中出现的偶然性错误;本文的研究针对的是汉语非母语写作中出现的规律性偏误。 在计算机辅助汉语教学方面,以往的研究热衷于计算机如何向学生单向地传授知识;而本文的研究重点是计算机如何对学生输入的信息给出反馈。 (2)技术思想 分析了计算机处理自然语言的能力以及处理各类偏误的能力,提出了利用计算机处理偏误时应遵循的指导思想。 (3)技术方法 基于HSK动态作文语料库,对“把”字句、“比”字句、“有”字句和“被”字句四种特殊句型的各种偏误做了具体分析,给出了识别及提示的规则,实验结果表明有较高的识别准确率和召回率。 提出了采用编辑距离算法进行偏误自动标注的方法,实验证明能明显提高标注的质量和速度。 本文的意义在于: 理论方面,探讨了计算机辅助语言教学的可能性,既不能停留在简单的多媒体教学手段方面,又不能希冀计算机能全自动地处理各类偏误,而是实事求是地指出在这一领域计算机能力所及的范围。此外,面向计算机进行偏误分析为汉语语法研究、对外汉语教学研究提出了新的关注视角。 应用方面,本文提出的方法可以辅助教师教学,减轻教师的负担;可以辅助科研人员进行中介语语料库的标注,提高标注的质量和速度;可以辅助有一定汉语基础的学生自学;有助于提高汉语作文评分的自动化程度。
【学位授予单位】:北京语言大学
【学位级别】:博士
【学位授予年份】:2008
【分类号】:H08

【引证文献】
中国期刊全文数据库 前1条
1 张宝林;;汉语中介语语料库建设的现状与对策[J];语言文字应用;2010年03期
中国硕士学位论文全文数据库 前1条
1 阮氏练;越南留学生“比”字句偏误分析[D];吉林大学;2011年
【参考文献】
中国期刊全文数据库 前10条
1 宋柔;计算机辅助汉语校对系统[J];当代语言学;2001年01期
2 吕滇雯;日本留学生汉语偏误分析之(一):动词重叠[J];汉语学习;2000年05期
3 柳英绿;韩汉语被动句对比——韩国留学生“被”动句偏误分析[J];汉语学习;2000年06期
4 戴国华;日本留学生汉语动词常见偏误分析[J];汉语学习;2000年06期
5 崔永华;汉语中介语中的"把…放…"短语分析[J];汉语学习;2003年01期
6 韩在均;韩国学生学习汉语“了”的常见偏误分析[J];汉语学习;2003年04期
7 董淑慧;;“A归A”的语义、语篇功能及偏误分析[J];汉语学习;2006年04期
8 周小兵;王宇;;与范围副词“都”有关的偏误分析[J];汉语学习;2007年01期
9 黄玉花;;韩国留学生汉语趋向补语习得特点及偏误分析[J];汉语学习;2007年04期
10 龚小谨,罗振声,骆卫华;中文文本自动校对中的语法错误检查[J];计算机工程与应用;2003年08期
【共引文献】
中国期刊全文数据库 前10条
1 孙敏;姚海燕;;园艺植物专家系统研究概况与发展趋势[J];安徽农业科学;2012年02期
2 刘丽华;;把字句中的向字短语研究[J];安徽文学(下半月);2006年08期
3 鲁洁;;从对等的角度研究对外汉语教材中生词的英语翻译问题[J];安徽文学(下半月);2009年03期
4 汪颖;;三个平面语法理论与对外汉语语法教学[J];安徽文学(下半月);2010年05期
5 唐瑞婷;;对外汉语教学中的词类偏误研究综述[J];安徽文学(下半月);2010年10期
6 武慧慧;;浅谈对外汉语教学中对学生语言偏误的分析[J];安徽文学(下半月);2011年12期
7 云晓燕;王春英;;基于最大树法的多文档文摘子主题划分[J];辽宁科技大学学报;2009年06期
8 何贞慧;朱乐红;;汉语存现句的界定分类及其在对外汉语教学中的作用[J];辽宁科技大学学报;2010年04期
9 王军;;古代汉语“有”字句研究综述[J];安顺师范高等专科学校学报(综合版);2006年01期
10 陈叶红;;现代汉语“有”字本义探讨[J];安阳工学院学报;2006年06期
中国重要会议论文全文数据库 前10条
1 刘善涛;李敏;;基于信息库的新词词汇共性分析与教学策略研究[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
2 加米拉·吾守尔;瓦依提·阿布力孜;吐尔根·依布拉音;;《现代维吾尔语语法信息词典》数据库建设的研究[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
3 杨佳玉;蔡蕾;王冰娇;解焱陆;;汉语学习者两类发音参数分布比较研究[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年
4 李立成;;来华留学生汉语言本科学历教育总体设计的意义[A];北京高校来华留学生教育研究[C];2008年
5 李影;付莉;;韩国中小学生“是”的错序偏误分析[A];语言与文化研究(第四辑)[C];2009年
6 甘灿;孙星明;刘玉玲;向凌云;;一种改进的基于同义词替换的中文文本信息隐藏方法[A];第七届全国信息隐藏暨多媒体信息安全学术大会论文集[C];2007年
7 张彦;;德国人学汉语的语音问题[A];第九届中国语音学学术会议论文集[C];2010年
8 王功平;;印尼留学生普通话平/翘舌辅音发音与元音关系[A];第九届中国语音学学术会议论文集[C];2010年
9 梅丽;;泰国学习者汉语普通话塞擦音知觉的实验研究[A];第九届中国语音学学术会议论文集[C];2010年
10 通拉嘎;;近十年对外汉字教学研究回顾与展望[A];福建省辞书学会第五届会员代表大会暨第十九届年会论文集[C];2009年
中国博士学位论文全文数据库 前10条
1 元莲仙;汉韩语言对比研究及在对韩汉语教学中的应用[D];南开大学;2010年
2 周扬;面向中药药性多维表征体系的中药本体研究[D];山东中医药大学;2010年
3 刘贵;精毛纺织品虚拟加工中的预报与反演模型研究[D];东华大学;2010年
4 李青;现代汉语把字句主观性研究[D];吉林大学;2011年
5 王欣;汉日否定表达对比研究[D];吉林大学;2011年
6 陈进杰;城市轨道交通项目广义全寿命周期成本理论与应用研究[D];北京交通大学;2011年
7 张海军;基于大规模语料的中文新词识别技术研究[D];中国科学技术大学;2011年
8 蔡心交;越汉成语对比研究[D];华东师范大学;2011年
9 阮氏丽娟;汉语方位词及其类型学特征[D];华东师范大学;2011年
10 王俊;现代汉语离合词研究[D];华中师范大学;2011年
中国硕士学位论文全文数据库 前10条
1 黄姗姗;系统功能理论视阈下的“X是X”结构研究[D];哈尔滨师范大学;2010年
2 张军珲;基于统计的常用汉语副词用法自动识别研究[D];郑州大学;2010年
3 程艳;日语被动态汉译的研究[D];上海外国语大学;2010年
4 陈炜;对外汉语教学成绩测试效度研究[D];上海外国语大学;2010年
5 陈德峰;基于《红楼梦》及其翻译对介词“在”和“in”的对比研究[D];上海外国语大学;2010年
6 张友学;句首介词“在”的隐现及其对外汉教学的启示[D];上海外国语大学;2010年
7 宝乐儿;初级阶段蒙古学生汉语发音偏误分析及相应的教学对策[D];上海外国语大学;2010年
8 解保忠;计算机在矽肺病早期诊断及预测中的应用研究[D];哈尔滨工程大学;2010年
9 付红艳;Web多文档自动文摘研究[D];哈尔滨工程大学;2010年
10 孔胜;文本资源的知识抽取研究[D];大连理工大学;2010年
【同被引文献】
中国期刊全文数据库 前10条
1 程书秋;“比”字句替换规律补议[J];北方论丛;2004年04期
2 丁信善;语料库语言学的发展及研究现状[J];当代语言学;1998年01期
3 火玥人;;“比”字句肯定式教学策略[J];华北电力大学学报(社会科学版);2009年03期
4 许国萍;;现代汉语“比”字句中情态动词意义分布考察[J];湖南师范大学社会科学学报;2005年06期
5 邵敬敏;语义对“比”字句中助动词位置的制约[J];汉语学习;1992年03期
6 许国萍;“比”字句研究综述[J];汉语学习;1996年06期
7 王茂林;留学生“比”字句习得的考察[J];暨南大学华文学院学报;2005年03期
8 周文华;肖奚强;;基于语料库的外国学生“被”字句习得研究[J];暨南大学华文学院学报;2009年02期
9 胡彩敏;;含数量结构比较项的“比”字句考察[J];江西社会科学;2006年01期
10 余敏;;“比”字句的否定形式“不比”的语用分析[J];重庆三峡学院学报;2008年01期
中国硕士学位论文全文数据库 前10条
1 肖小平;越南留学生汉语比较句偏误分析及习得顺序考察[D];广西师范大学;2004年
2 王健瑶;和汉语“比”字句相关问题研究[D];上海师范大学;2006年
3 季艳;特殊“比”字句的研究与教学[D];苏州大学;2006年
4 刘红娟;留学生学习汉语比较句式的偏误分析[D];天津师范大学;2006年
5 代雪曦;对外汉语“比”字句的学与教[D];四川大学;2006年
6 高云玲;现代汉语“比”字句考察[D];安徽师范大学;2007年
7 陈卓伦;关于英汉语法对比研究在对外汉语语法教学中的应用[D];四川大学;2007年
8 王炜;现代汉语“比”字句研究[D];四川大学;2007年
9 郑湖静;汉韩“比”字句对比分析[D];上海外国语大学;2007年
10 邓静怡;汉语“比”的语法化研究[D];四川师范大学;2008年
【二级引证文献】
中国期刊全文数据库 前3条
1 张宝林;;关于通用型汉语中介语语料库标注模式的再认识[J];世界汉语教学;2013年01期
2 崔希亮;张宝林;;全球汉语学习者语料库建设方案[J];语言文字应用;2011年02期
3 郑艳群;;语料库技术在汉语教学中的应用透视[J];语言文字应用;2013年01期
中国博士学位论文全文数据库 前1条
1 李菡幽;基于学习策略的汉语作为第二语言语法偏误研究[D];福建师范大学;2011年
【二级参考文献】
中国期刊全文数据库 前10条
1 李春红;初级阶段外国留学生的动词偏误[J];八桂侨刊;2004年04期
2 王健昆;汉语话语结构问题及其在写作训练中的影响[J];北京师范大学学报(人文社会科学版);2001年06期
3 刘丹青;汉语中的框式介词[J];当代语言学;2002年04期
4 袁毓林;句子的焦点结构及其对语义解释的影响[J];当代语言学;2003年04期
5 张仰森,丁冰青,龙一飞;一种英文单词拼写自动侦错与纠错的方法──骨架键法[J];电脑开发与应用;1999年02期
6 吴葆棠;为什么不能说“把书买了。”?[J];汉语学习;1980年01期
7 瓯齐;用助词“得”连接的补语所表达的意义[J];汉语学习;1983年04期
8 肖奚强;“连”字歧义句补议[J];汉语学习;1992年01期
9 饶勤;离合词的结构特点和语用分析──兼论中高级对外汉语离合词的教学[J];汉语学习;1997年01期
10 肖奚强;“除了”句式句法语义分析[J];汉语学习;2004年02期
中国重要会议论文全文数据库 前1条
1 ;上海华理催化净化器有限公司新产品简介[A];汽车催化净化技术产业化与发展战略研讨会专集[C];1999年
中国硕士学位论文全文数据库 前1条
1 高思欣;留学生汉语动宾式离合词偏误分析[D];暨南大学;2002年
【相似文献】
中国期刊全文数据库 前10条
1 伍时燕;;高职学生英语写作中中介语的偏误分析及教学策略[J];顺德职业技术学院学报;2008年03期
2 王晓燕;英语学习者作文中的中介语偏误分析[J];湘潭师范学院学报(社会科学版);2005年03期
3 陈莉;;二语习得中的偏误分析[J];新乡教育学院学报;2008年02期
4 王瑛;;二语习得中的中介语偏误分析及其认知发生[J];西安外国语大学学报;2007年04期
5 张玉玉;段涛涛;;中介语学习中的语法偏误分析[J];新疆职业大学学报;2008年05期
6 汤玲;;日本留学生中介语语音偏误分析[J];现代语文(语言研究版);2010年07期
7 凌德祥;中介语理论与对外汉语教学[J];南京大学学报(哲学.人文科学.社会科学版);2003年03期
8 张少林,柏敬泽;试析广西大学生英语中介语偏误中的辅音音位偏误[J];广西教育学院学报;2003年03期
9 蔡崇尧;对维吾尔族学生汉语学习中偏误的分析[J];语言与翻译;2000年01期
10 王晓燕;中介语对话偏误分析及纠误策略[J];株洲师范高等专科学校学报;2005年03期
中国重要会议论文全文数据库 前10条
1 易绵竹;薛恩奎;李绍哲;南振兴;;一种与UNL接口的机器翻译系统ETAP-3概要[A];机器翻译研究进展——2002年全国机器翻译研讨会论文集[C];2002年
2 熊子瑜;;中介语声调系统的评价方法研究[A];第九届全国人机语音通讯学术会议论文集[C];2007年
3 王斌;郭庆;李中博;杨晓春;;支持块编辑距离的索引结构[A];第26届中国数据库学术会议论文集(A辑)[C];2009年
4 李刚;郭崇慧;林鸿飞;杨志豪;唐焕文;;基于词典法和机器学习法相结合的蛋白质名识别[A];大连理工大学生物医学工程学术论文集(第2卷)[C];2005年
5 通拉嘎;;近十年对外汉字教学研究回顾与展望[A];福建省辞书学会第五届会员代表大会暨第十九届年会论文集[C];2009年
6 王洁;宋柔;;HSK动态作文语料库偏误标注方法研究[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
7 邓瑶;;PSC中双音节词语轻重格式的常见偏误分析及对策[A];第三届全国普通话水平测试学术研讨会论文集[C];2007年
8 邓丹;;美国学习者汉语复合元音的偏误分析[A];第九届中国语音学学术会议论文集[C];2010年
9 韩玉华;;香港考生在PSC“说话”中常见的语法偏误分析[A];第二届全国普通话水平测试学术研讨会论文集[C];2004年
10 王雪松;;解析英语写作中的石化现象[A];“高教强省”探索与实践——高教科研2008[C];2009年
中国重要报纸全文数据库 前4条
1 山西财经大学华商学院 吴娟娟;基于中介语语料库的程度副词偏误分析[N];山西经济日报;2011年
2 贵阳市经贸学校 张敏;英语专业交际策略的培训[N];经济信息时报;2007年
3 浙江理工大学外国语学院 潘月明;英语教育要有创意[N];光明日报;2005年
4 记者宋晖 通讯员张新红;语用学研究趋向多元化[N];中国社会科学报;2011年
中国博士学位论文全文数据库 前10条
1 王洁;汉语中介语偏误的计算机处理方法研究[D];北京语言大学;2008年
2 岳辉;朝鲜时代汉语官话教科书研究[D];吉林大学;2008年
3 孔艳;英语国家留学生汉语语篇衔接手段使用研究[D];中央民族大学;2009年
4 李琳;外国学生习得汉语语气副词调查研究[D];华东师范大学;2006年
5 夏迪娅·伊布拉音;维吾尔民族汉语教学历史与现状研究[D];新疆大学;2006年
6 于天昱;现代汉语反问句研究[D];中央民族大学;2007年
7 番秀英;汉语和泰语个体量词对比研究[D];北京语言大学;2009年
8 林美淑;对韩汉语教学离合词研究[D];山东大学;2005年
9 李遐;新疆维吾尔族学生汉语介词学习研究[D];华东师范大学;2006年
10 戴东波;序列数据的相似性查询研究[D];复旦大学;2009年
中国硕士学位论文全文数据库 前10条
1 王晓燕;二语习得过程中的中介语对话偏误分析[D];湖南师范大学;2003年
2 周荔;面向对外汉语的离合词研究[D];西南大学;2009年
3 殷苏芬;外国学生形容词谓语句偏误分析与习得研究[D];南京师范大学;2008年
4 吴娟娟;外国学生程度副词偏误分析与习得研究[D];南京师范大学;2007年
5 黄自然;外国学生存现句偏误分析及习得研究[D];南京师范大学;2008年
6 游红明;初级阶段韩国学生汉语动词词组偏误分析[D];四川大学;2006年
7 陆苏静;从相似性角度看中介语中的程度副词偏误现象[D];上海师范大学;2009年
8 黄燕;韩国学生初级词偏误分析[D];四川大学;2005年
9 沈安怡;“倒”和“却”的对比分析及教学研究[D];复旦大学;2010年
10 郑恩贞;韩国学生汉语语气副词习得研究[D];南京师范大学;2008年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026