收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

IHSMTS中汉英双语句子对齐机制的设计与实现

祝志杰  
【摘要】: 在当前的机器翻译研究中,提出了一种以多策略机器翻译思想为指导,融合了基于规则和基于实例两种策略优点的人机互动多策略机器翻译系统(IHSMTS),大大提高了翻译质量。 该系统中需要一个大规模、高质量的双语语料库,而要建设这样一个双语库,其中的关键技术就是双语句子对齐。 本文针对当前汉英双语句子对齐研究中存在的问题,提出了一些新的想法。 首先,本文通过统计分析,验证了汉英双语文本之间存在着较为稳定的长度和词汇关系规律,并根据汉英两种语言自身的一些特点,提出一种长度、词汇信息相结合的汉英双语句子对齐方法,实验表明该方法具有较高的句子对齐正确率; 第二,本文采用了分段对齐的思想。考虑到基于回车符的方法在实际应用中的缺陷,本文提出一种基于锚点句对的分段对齐方法。并根据实际需求,本文将上述两种方法相结合,形成了一种多层次分段对齐方法,进一步提高了句子对齐的运行效率和正确率; 第三,考虑到双语句对在IHSMTS双语语料库中的实际应用,本文提出分割复杂句对的后处理思想,有效地提高了双语句对的质量。 根据以上思想,本文最终实现了一个较为完善、可靠、实用的汉英双语句子对齐系统,从而为IHSMTS系统双语语料库的建设提供了强有力的支持。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 林哲辉;贾剑锋;郭文;;新闻领域双语语料建设与句子对齐方法的研究[J];电脑与信息技术;2008年01期
2 马靖然;使用Word XP的几点技巧[J];中国科技信息;2005年14期
3 黄辉;;一种线材对齐卸卷的方法[J];科技传播;2011年17期
4 吴绘萍;吴清芳;;Word中表格复制时行对齐的问题[J];电脑知识与技术;2005年31期
5 ;Excel分散对齐的妙用[J];工会博览(社会版);2007年03期
6 江诗锋;何振峰;;基于特征点的行车数据序列对齐[J];福州大学学报(自然科学版);2010年02期
7 赵翠萍;;关于教材编写过程中图片的处理[J];职业教育研究;2011年06期
8 王斌,刘群,张祥;汉英双语库自动分段对齐研究[J];软件学报;2000年11期
9 卢光跃,保铮;ISAR成像中具有游动部件目标的包络对齐[J];系统工程与电子技术;2000年06期
10 丁健,周游,江南,张万军;应用程序“右顺序对齐菜单”编程方法[J];计算机系统应用;2002年03期
11 小渔;数字按小数点对齐[J];电脑迷;2004年07期
12 刘爱芳,李彧晟,朱晓华;用改进的包络最小熵法进行包络对齐[J];信号处理;2005年01期
13 王大鹏;姜怡;姜欣;;语料库在茶典籍英译中的实例应用[J];沈阳师范大学学报(自然科学版);2010年02期
14 禹龙;田生伟;杨飞宇;;汉维语短语搭配的识别和对齐[J];计算机应用与软件;2011年06期
15 钱丽萍,赵铁军,杨沫昀,高光来;基于译文的英汉双语句子自动对齐[J];计算机工程与应用;2000年12期
16 晋薇,夏云庆,王建德;交互式机译系统IHSMTS的多策略翻译引擎[J];计算机工程;2002年07期
17 常宝宝,詹卫东,张华瑞;面向汉英机器翻译的双语语料库的建设及其管理[J];术语标准化与信息技术;2003年01期
18 刘小虎,吴葳,李生,赵铁军,蔡萌,鞠英杰;基于词典和统计的语料库词汇级对齐算法[J];情报学报;1997年01期
19 王长胜,刘群;基于实例的汉英机器翻译系统研究与实现[J];计算机工程与应用;2002年08期
20 吴宏林 ,吕学强 ,任飞亮 ,赵英科 ,姚天顺;基于语料库的最小求交词对齐[J];小型微型计算机系统;2004年07期
中国重要会议论文全文数据库 前10条
1 田亮;黄辉;周沁;;面向短语的词语对齐方法[A];机器翻译研究进展——第七届全国机器翻译研讨会论文集[C];2011年
2 华却才让;;藏汉句子局部对齐策略的研究[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年
3 李竹;;基于英汉双语语料库的词汇自动对齐实验系统[A];语言文字应用研究论文集(Ⅱ)[C];2004年
4 陈坚忠;李鹏;孙茂松;;越汉双语句子自动对齐研究初步[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
5 彭国珍;邹纲;;基于汉英双语语料库述宾短语的自动抽取[A];第二届全国学生计算语言学研讨会论文集[C];2004年
6 罗维;吉宗诚;吕雅娟;刘群;;一种改进词语对齐的新方法[A];第五届全国青年计算语言学研讨会论文集[C];2010年
7 李维刚;刘挺;李生;;基于双语语料库的短语复述实例获取研究[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
8 刘非凡;赵军;徐波;;大规模非限定领域汉英双语语料库建设及句子对齐研究[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
9 王辰;宋国龙;吴宏林;张俐;刘绍明;;基于序列相交的短语译文获取[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
10 李维刚;刘挺;王震;李生;;双语语料库段落重组对齐方法研究[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
中国博士学位论文全文数据库 前10条
1 马延军;干扰对齐及其在现代无线通信系统中的应用[D];西安电子科技大学;2012年
2 黄书剑;统计机器翻译中的词对齐研究[D];南京大学;2012年
3 方淼;语义单元自动获取研究[D];大连理工大学;2008年
4 王斌;汉英双语语料库自动对齐研究[D];中国科学院研究生院(计算技术研究所);1999年
5 屈刚;英汉双语短语对齐[D];上海交通大学;2007年
6 刘东飞;智能双语搜索方法及搜索引擎的研究[D];武汉理工大学;2009年
7 李海艳;面向反求工程的多传感器集成及数据融合技术研究[D];华中科技大学;2010年
8 卢光跃;逆合成孔径雷达(ISAR)成像技术的改进[D];西安电子科技大学;1999年
9 冯敏萱;论汉英平行语料的平行处理[D];南京师范大学;2006年
10 薛永增;统计机器翻译若干关键技术研究[D];哈尔滨工业大学;2007年
中国硕士学位论文全文数据库 前10条
1 祝志杰;IHSMTS中汉英双语句子对齐机制的设计与实现[D];南京理工大学;2002年
2 王飞;多语种双语对齐平台的设计与实现[D];南京理工大学;2004年
3 程文东;IHSMTS中基于片断的类比匹配机制的设计与实现[D];南京理工大学;2002年
4 谭勋;维吾尔语句子中词聚类及其汉维词对齐的研究[D];新疆大学;2012年
5 段恋;基于短语句法结构的树—串汉英对齐模板抽取研究[D];北京邮电大学;2010年
6 刘建明;基于统计机器翻译的汉维词对齐研究[D];新疆大学;2010年
7 赵小曼;英汉平行语料库句子级对齐研究及其在机器翻译中的应用[D];安徽大学;2010年
8 庞珊娜;基于Web的双语资源信息抽取研究[D];天津大学;2008年
9 龚贺华;LSS-DCA:一个快速的分治多序列对齐算法[D];浙江大学;2003年
10 麦丽开·阿布德瓦力;面向机器翻译的汉维词语对齐规范[D];新疆大学;2012年
中国重要报纸全文数据库 前10条
1 宋志明;显示对象快速对齐[N];中国电脑教育报;2003年
2 蔡峻;也看Word中的对齐问题[N];中国电脑教育报;2004年
3 宗建华 李彤 朱华昌;和竞争对手一起赚钱 [N];中国石化报;2003年
4 许向前;巧用表格让选择题选项对齐[N];中国电脑教育报;2003年
5 徐育兵;完形填空选项巧对齐[N];电脑报;2003年
6 丁健 张万军 江南;右顺序对齐菜单实现方法[N];计算机世界;2001年
7 陶锦云;巧用制表符让选项对齐[N];中国电脑教育报;2003年
8 本报记者 李守苓;暑假打工现象你怎么看[N];中国石化报;2001年
9 本报记者 许立群;齐晖:在否定中成长[N];人民日报;2003年
10 刘丽芳;省人大调研组结束对齐调研[N];齐齐哈尔日报;2008年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978