收藏本站
收藏 | 论文排版

面向汉英专利文献的神经网络翻译模型的集外词翻译研究

郑晓康  
【摘要】:机器翻译(Machine Translation,MT)的目的是为源语言找到一个意思最为相近的目标语言。从本质上来看,机器翻译完成的是一个序列到序列的任务。近年来随着深度神经网络(Deep Neural Network,DNN)在语音识别和图像处理等方面取得突破性进展,研究人员开始着手使用深度神经网络处理符号变量方面的问题,例如自然语言处理领域的机器翻译任务。神经网络机器翻译(Neural Machine Translation,NMT)包含编码器和解码器两个神经网络,编码器把源语言转化成一个向量表示,解码器根据源语言的向量表示加上目标语言的历史信息生成目标语言的词序列。为了控制计算复杂度,大多数的NMT系统会限制源语言和目标语言的词典大小,一般设置为三万词到八万词之间。对于不在词典中的词,也就是集外词,使用符号“UNK”来代替。集外词带来几个问题,一个是在测试过程中,模型不能够生成合适的翻译结果;另一个是集外词导致源语言句子语义无法正确表示,加重翻译结果的歧义现象;第三个是训练语料中源语言和目标语言句子结构被严重破坏,神经网络参数质量不高。在专利文献语料中存在大量的低频词,导致这几个问题更为严重。本论文以专利文献的集外词翻译为切入点,以中英神经网络机器翻译为主要研究方向,重点研究并提出了一种改善集外词翻译问题的方法,从而提高神经网络机器翻译的效果。主要研究成果如下:(1)引入统计机器翻译中的对齐信息,以外部信息的形式加入语料库词典,当出现集外词时根据神经网络机器翻译中的注意力机制,对集外词进行翻译。(2)对语料中的技术术语进行标签化处理,以前后处理的方式翻译技术术语。(3)加入多模型融合机制,即同时训练多个翻译模型,在解码时根据多个翻译模型得到的结果调整注意力机制权重信息,挑选最优结果。本文将集外词处理作为研究重点,在中英专利语料上的实验结果表明,本文提出的方法能有效的处理集外词和专利术语,使翻译效果得到提升。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 杨晓帅 ,付玫;神经网络技术让管理更轻松[J];软件世界;2000年11期
2 云中客;新的神经网络来自于仿生学[J];物理;2001年10期
3 唐春明,高协平;进化神经网络的研究进展[J];系统工程与电子技术;2001年10期
4 李智;一种基于神经网络的煤炭调运优化方法[J];长沙铁道学院学报;2003年02期
5 程科,王士同,杨静宇;新型模糊形态神经网络及其应用研究[J];计算机工程与应用;2004年21期
6 王凡,孟立凡;关于使用神经网络推定操作者疲劳的研究[J];人类工效学;2004年03期
7 周丽晖;从统计角度看神经网络[J];统计教育;2005年06期
8 赵奇 ,刘开第 ,庞彦军;灰色补偿神经网络及其应用研究[J];微计算机信息;2005年14期
9 袁婷;;神经网络在股票市场预测中的应用[J];软件导刊;2006年05期
10 尚晋;杨有;;从神经网络的过去谈科学发展观[J];重庆三峡学院学报;2006年03期
11 杨钟瑾;;神经网络的过去、现在和将来[J];青年探索;2006年04期
12 林静怡;朱建平;;优化问题神经网络方法的发展及有待解决的问题[J];统计教育;2006年11期
13 王鸿斌;张立毅;;新型神经网络的发展及其应用[J];忻州师范学院学报;2007年02期
14 常国任;李仁松;沈医文;刘钢;;基于神经网络的直升机舰面系统效能评估[J];舰船电子工程;2007年03期
15 刘彩红;唐万梅;;基于组合神经网络的教师评价模型研究[J];重庆师范大学学报(自然科学版);2008年04期
16 旷章辉;王甲海;周雅兰;;用改进的竞争Hopfield神经网络求解多边形近似问题[J];计算机科学;2009年03期
17 黄松;杨小帆;;离散时间神经网络的研究进展[J];计算机应用研究;2009年08期
18 ;第7届神经网络国际研讨会(英文)[J];智能系统学报;2009年04期
19 陈俊;;神经网络的应用与展望[J];佛山科学技术学院学报(自然科学版);2009年05期
20 俸世洲;周尚波;;SOM神经网络在独立学院招生决策中的应用[J];计算机工程与科学;2011年05期
中国重要会议论文全文数据库 前10条
1 徐春玉;;基于泛集的神经网络的混沌性[A];1996中国控制与决策学术年会论文集[C];1996年
2 周树德;王岩;孙增圻;孙富春;;量子神经网络[A];2003年中国智能自动化会议论文集(上册)[C];2003年
3 罗山;张琳;范文新;;基于神经网络和简单规划的识别融合算法[A];2009系统仿真技术及其应用学术会议论文集[C];2009年
4 郭爱克;马尽文;丁康;;序言(二)[A];1999年中国神经网络与信号处理学术会议论文集[C];1999年
5 钟义信;;知识论:神经网络的新机遇——纪念中国神经网络10周年[A];1999年中国神经网络与信号处理学术会议论文集[C];1999年
6 许进;保铮;;神经网络与图论[A];1999年中国神经网络与信号处理学术会议论文集[C];1999年
7 金龙;朱诗武;赵成志;陈宁;;数值预报产品的神经网络释用预报应用[A];1999年中国神经网络与信号处理学术会议论文集[C];1999年
8 田金亭;;神经网络在中学生创造力评估中的应用[A];第十二届全国心理学学术大会论文摘要集[C];2009年
9 唐墨;王科俊;;自发展神经网络的混沌特性研究[A];2009年中国智能自动化会议论文集(第七分册)[南京理工大学学报(增刊)][C];2009年
10 张广远;万强;曹海源;田方涛;;基于遗传算法优化神经网络的故障诊断方法研究[A];第十二届全国设备故障诊断学术会议论文集[C];2010年
中国博士学位论文全文数据库 前10条
1 杨旭华;神经网络及其在控制中的应用研究[D];浙江大学;2004年
2 李素芳;基于神经网络的无线通信算法研究[D];山东大学;2015年
3 石艳超;忆阻神经网络的混沌性及几类时滞神经网络的同步研究[D];电子科技大学;2014年
4 王新迎;基于随机映射神经网络的多元时间序列预测方法研究[D];大连理工大学;2015年
5 付爱民;极速学习机的训练残差、稳定性及泛化能力研究[D];中国农业大学;2015年
6 李辉;基于粒计算的神经网络及集成方法研究[D];中国矿业大学;2015年
7 王卫苹;复杂网络几类同步控制策略研究及稳定性分析[D];北京邮电大学;2015年
8 张海军;基于云计算的神经网络并行实现及其学习方法研究[D];华南理工大学;2015年
9 李艳晴;风速时间序列预测算法研究[D];北京科技大学;2016年
10 陈辉;多维超精密定位系统建模与控制关键技术研究[D];东南大学;2015年
中国硕士学位论文全文数据库 前10条
1 章颖;混合不确定性模块化神经网络与高校效益预测的研究[D];华南理工大学;2015年
2 贾文静;基于改进型神经网络的风力发电系统预测及控制研究[D];燕山大学;2015年
3 李慧芳;基于忆阻器的涡卷混沌系统及其电路仿真[D];西南大学;2015年
4 陈彦至;神经网络降维算法研究与应用[D];华南理工大学;2015年
5 董哲康;基于忆阻器的组合电路及神经网络研究[D];西南大学;2015年
6 武创举;基于神经网络的遥感图像分类研究[D];昆明理工大学;2015年
7 李志杰;基于神经网络的上证指数预测研究[D];华南理工大学;2015年
8 陈少吉;基于神经网络血压预测研究与系统实现[D];华南理工大学;2015年
9 张韬;几类时滞神经网络稳定性分析[D];渤海大学;2015年
10 邵雪莹;几类时滞不确定神经网络的稳定性分析[D];渤海大学;2015年
中国重要报纸全文数据库 前10条
1 美国明尼苏达大学社会学博士 密西西比州立大学国家战略规划与分析研究中心资深助理研究员 陈心想;维护好创新的“神经网络硬件”[N];中国教师报;2014年
2 卢业忠;脑控电脑 惊世骇俗[N];计算机世界;2001年
3 葛一鸣 路边文;人工神经网络将大显身手[N];中国纺织报;2003年
4 中国科技大学计算机系 邢方亮;神经网络挑战人类大脑[N];计算机世界;2003年
5 记者 孙刚;“神经网络”:打开复杂工艺“黑箱”[N];解放日报;2007年
6 本报记者 刘霞;美用DNA制造出首个人造神经网络[N];科技日报;2011年
7 健康时报特约记者  张献怀;干细胞移植:修复受损的神经网络[N];健康时报;2006年
8 刘力;我半导体神经网络技术及应用研究达国际先进水平[N];中国电子报;2001年
9 ;神经网络和模糊逻辑[N];世界金属导报;2002年
10 邹丽梅 陈耀群;江苏科大神经网络应用研究通过鉴定[N];中国船舶报;2006年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978