收藏本站
《黑龙江大学》 2012年
收藏 | 手机打开
二维码
手机客户端打开本文

汉英人名自动翻译方法的研究

李鑫鑫  
【摘要】:随着互联网的飞速发展和全球化的不断深入,中文网络文本中蕴含有大量的中国人名和来自不同民族或国度的外国译名。如何根据人名的结构特点识别中文文本中的人名的来源,并根据其来源将其翻译成英文已经成为机器翻译和跨语言信息检索等研究领域的一个焦点。 根据汉语文本中不同来源人名的构成方式和用字规律,本文研究外国音译人名来源,包括欧美、日本、韩国等识别方法,进而探索汉英人名自动翻译方法。本文研究不仅可以完善汉语人名识别和汉英人名翻译方法和理论,而且在机器翻译,问答系统和跨语言信息检索等领域具有十分广阔的应用前景。具体地,本文从以下三个个方面展开研究: 首先,以字作为基本处理单位,采用统计方法对中文文本的人名和外国译名进行信息统计,并分析了欧美、日本、韩国等不同来源的汉语人名的结构特点和用字规律。 其次,本文将汉语人名的来源识别看作是一个分类问题,在分析不同中文名字和译名特点基础上,分别考虑了人名长度、人名中字的位置以及n-gram等特征,并分别利用最大熵模型、支持向量机模型和朴素贝叶斯模型融合这些特征进行人名来源识别,重点探索了不同特征和不同分类器模型对于汉语人名来源识别的影响。实验结果表明基于字的支持向量机模型对中、日、韩和欧美四个国家的汉语人名来源识别效果最好。 最后,本文在汉语人名来源识别基础上,采用一种基于规则的汉英音译单元对齐算法进行汉英音译单元的对齐,并在基于字形的汉英机器音译框架下,采用隐马尔可科夫模型将不同来源的汉语人名音译成英语。初步的实验证明,事先识别人名来源可极大提高汉-英人名音译性能。
【学位授予单位】:黑龙江大学
【学位级别】:硕士
【学位授予年份】:2012
【分类号】:TP391.2

手机知网App
【参考文献】
中国期刊全文数据库 前3条
1 蒋龙;周明;简立峰;;利用音译和网络挖掘翻译命名实体[J];中文信息学报;2007年01期
2 庞薇;徐波;;基于多模型融合的人名翻译系统[J];中文信息学报;2009年01期
3 周国强;崔荣一;;基于朴素贝叶斯分类器的朝鲜语文本分类的研究[J];中文信息学报;2011年04期
中国硕士学位论文全文数据库 前1条
1 周美玲;英汉人名音译方法的研究与实现[D];苏州大学;2009年
【共引文献】
中国期刊全文数据库 前10条
1 厚雯;;音译外来词在现代汉语系统中的存在情况考察——以《现代汉语规范词典》为例[J];北京广播电视大学学报;2011年02期
2 陈昱;;也谈美国华裔作家姓名的翻译问题[J];北京社会科学;2008年06期
3 舒启全;英语专名汉译原则[J];成都大学学报(社会科学版);2004年03期
4 段怡红;肖学年;朱健;吕玉霞;马聪丽;郭玉芳;;《大地测量术语》修订说明[J];测绘标准化;2009年02期
5 申文明;刘连芳;黄家裕;温家凯;;基于概率模型的汉语和越南语的人名音译方法[J];广西科学院学报;2010年04期
6 冯月进;张凤斌;;最大相关最小冗余限定性贝叶斯网络分类器学习算法[J];重庆大学学报;2014年06期
7 王燕;王金波;;论“赵氏孤儿”题材剧里的人物命名——兼谈戏剧编译时对人名问题的处理[J];北京第二外国语学院学报;2006年10期
8 孙萌;梁颖红;葛运东;颜振祥;姚建民;;基于平行语料库和网络的未登录词译文挖掘[J];江南大学学报(自然科学版);2010年01期
9 郑小新,郭蕴青,罗苑娜;ICD-10中有关综合征分类的探讨[J];中国医院统计;2002年01期
10 赵军;;命名实体识别、排歧和跨语言关联[J];中文信息学报;2009年02期
中国博士学位论文全文数据库 前6条
1 陈竹华;证券法域外管辖权的合理限度[D];中国政法大学;2006年
2 任晓霏;“译者登场”——英若诚戏剧翻译系统研究[D];上海外国语大学;2009年
3 李明倩;《威斯特伐利亚和约》研究[D];华东政法大学;2012年
4 姚展鹏;香港回归前后重大项目规划政策比较[D];清华大学;2011年
5 刘博;1549年凯特起义[D];中国社会科学院研究生院;2012年
6 喻珍;冷战后地区主义视角下的海湾地区合作[D];上海外国语大学;2014年
中国硕士学位论文全文数据库 前10条
1 张敏;尤内斯库作品在中国1978年至今[D];上海外国语大学;2010年
2 宋松岩;英语人名音译的优选论分析[D];北京林业大学;2011年
3 张春越;统计机器翻译中树到串对齐模板模型系统实现和比较研究[D];哈尔滨工业大学;2010年
4 陈洁华;英译汉中的长句处理[D];上海交通大学;2010年
5 郭晓静;从英汉语言差异及文化差异看英语新闻报道的汉译[D];上海交通大学;2011年
6 段晓鑫;从奈达的等值翻译理论看英语学术论文的汉译[D];上海交通大学;2011年
7 王鹏;从可比较语料中抽取中英命名实体等价对[D];大连理工大学;2011年
8 任常辉;农村宅基地使用权流转意愿及其影响因素研究[D];西安工业大学;2012年
9 周颖;论中英人名翻译[D];四川大学;2003年
10 陈王青;虚构专名英译中的行为常式[D];广东外语外贸大学;2007年
【二级参考文献】
中国期刊全文数据库 前7条
1 张璇;左敏;;一种改进的朴素贝叶斯分类器在文本分类中的应用研究[J];北京工商大学学报(自然科学版);2009年04期
2 张雯;张化祥;;属性加权的朴素贝叶斯集成分类器[J];计算机工程与应用;2010年29期
3 何国辉;吴礼发;;基于机器学习的文本分类技术的研究[J];计算机与现代化;2009年08期
4 王斌;基于未对齐汉英双语库的翻译对抽取[J];中文信息学报;2000年06期
5 刘群;统计机器翻译综述[J];中文信息学报;2003年04期
6 刘冬明,赵军,杨尔弘;汉英双语语料库中名词短语的自动对应[J];中文信息学报;2003年05期
7 毕玉德;面向语言信息处理的朝鲜语知识库研究[J];中文信息学报;2005年03期
中国博士学位论文全文数据库 前1条
1 吴科;基于机器学习的文本分类研究[D];上海交通大学;2008年
中国硕士学位论文全文数据库 前1条
1 梅君;中文文本分类的研究与应用[D];南昌大学;2010年
【相似文献】
中国期刊全文数据库 前10条
1 杨经,方应谦;基于语言知识的手写汉语文本自动识别初探[J];计算机研究与发展;1998年07期
2 黄钢石;陆建江;张亚非;;文本信息处理中的自动文摘方法研究[J];军事通信技术;2004年01期
3 顾晓鸣 ,顾志强;用中国人的视角,用中国人的方法做电视、看电视、说电视[J];当代电视;1995年03期
4 朱瑞康,季汉涛;CSCP汉语文本─语音合成系统[J];小型微型计算机系统;1996年07期
5 迟呈英,麻志毅,姚天顺;文本理解与汉语文本结构分析[J];中文信息;1997年01期
6 王忠效,范植华;汉语文本动态字母表0阶模型算术编码[J];中文信息学报;2000年01期
7 支天云,张仰森;基于BP网络的汉语文本词类标注方法[J];山西大学学报(自然科学版);2001年01期
8 ;关于汉字的熵和极限熵致编辑部的一封信[J];中文信息学报;1998年01期
9 张月杰,姚天顺;基于特征相关性的汉语文本自动分类模型的研究[J];小型微型计算机系统;1998年08期
10 郑德权;汉语文本计算机校对的词库设计[J];中文信息;1999年01期
中国重要会议论文全文数据库 前10条
1 宋柔;;汉语文本检索软件CCRL[A];2004年辞书与数字化研讨会论文集[C];2004年
2 王慧玲;宋柔;戴伟长;;汉语文本按语体分类的研究[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
3 张鑫;程学旗;谭建龙;王映;;一种快速的多模式串匹配算法及其在实时汉语文本分类系统中的应用[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
4 克平;李杨;王培培;;汉武帝《秋风辞》的番语译文[A];西夏学(第四辑)[C];2009年
5 单永明;;汉语文本的篇章结构及其标引算法的研究[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
6 赵园丁;由丽萍;张惠春;谷波;刘开瑛;;基于框架语义的汉语文本知识表示方法[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
7 高路;黄贤军;莫静清;杨玉芳;;汉语文本语篇语句焦点的确定[A];第九届全国人机语音通讯学术会议论文集[C];2007年
8 付国宏;王晓龙;龚永红;;基于词形的汉语文本切分方法[A];第五届全国人机语音通讯学术会议论文集[C];1998年
9 莫锦贤;马常楼;;文本文件转换成语音文件及其合成输出[A];第二届全国人机语音通讯学术会议论文集[C];1992年
10 孙玉琦;张凯;王晓龙;徐志明;;基于规则和统计相结合的多音字研究[A];第五届全国人机语音通讯学术会议论文集[C];1998年
中国重要报纸全文数据库 前4条
1 俞东升;大恒笔2000技巧几则[N];计算机世界;2000年
2 周瓒;希尼日常生活的神奇和紧张[N];中国图书商报;2001年
3 池昌海;亟待规范的书写形式:拼音字母缩写(上)[N];语言文字周报;2005年
4 黄忠廉;文化输出需大力提倡“变译”[N];光明日报;2010年
中国博士学位论文全文数据库 前4条
1 冯敏萱;论汉英平行语料的平行处理[D];南京师范大学;2006年
2 郝立丽;汉语文本数据挖掘[D];吉林大学;2009年
3 倪盛俭;汉语文本蕴涵识别研究[D];武汉大学;2013年
4 裘江南;汉语文本中突发事件因果关系抽取方法研究[D];大连理工大学;2012年
中国硕士学位论文全文数据库 前10条
1 卢忠良;基于多类的汉语文本自动分类研究[D];中国人民解放军国防科学技术大学;2002年
2 娄(王廷);现代汉语分词系统通用性设计及切分歧义处理[D];北京工业大学;2000年
3 朱磊;自然语言处理之汉语文本自动校对[D];电子科技大学;2005年
4 张剑;汉语文本作者识别方法的研究与实现[D];上海交通大学;2007年
5 曹艳;汉语文本抄袭识别系统研究[D];南京农业大学;2008年
6 庄明;装备发展战略研究信息化平台中汉语文本信息提取技术的研究[D];国防科学技术大学;2003年
7 郭望皓;对外汉语文本易读性公式研究[D];上海交通大学;2010年
8 梁文婷;汉语文本主题分析技术的研究与实现[D];重庆大学;2008年
9 黄婷;译入与译出——《茶馆》两个英译本的对比研究[D];湖南大学;2009年
10 唐培丽;基于语义的汉语文本主题词提取算法研究与实现[D];吉林大学;2005年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026