收藏本站
收藏 | 论文排版

多语种双语对齐平台的设计与实现

王飞  
【摘要】:双语语料库在基于实例的机器翻译、翻译知识的获取、双语词典的建立、词义消歧等领域有着重要的应用价值。大规模双语语料库的建设是进行基于语料库研究的基础。当今互联网上存在着大量的双语互译文本,如何通过这些双语互译文本来建立大规模的双语语料库,对双语互译文本的加工成为至关重要的问题。 双语对齐技术是加工双语文本的核心。本文结合基于句子长度和基于词典的两种经典对齐算法思想,通过确定锚点句对对双语互译文本进行划分,实现了双语句子对齐,进一步提高了双语句子对齐的准确率。同时,本文还针对基于词典的双语对齐中双语词典单词词义的召回率不高的问题提出了一种新的词义模糊匹配方法,大大提高了词典中单词词义的召回率,为提供准确快速的双语句子对齐提供了条件。 根据上述思想,本文最终实现了一个准确、可靠、实用的双语句子对齐系统,为双语语料库的建设提供强有力的工具。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 陈博兴,杜利民;基于双语对齐口语语料的翻译词典的自动生成[J];计算机学报;2003年03期
2 屈刚,陈笑蓉,陆汝占;基于有效句型的英汉双语短语对齐[J];计算机研究与发展;2003年02期
3 宋冰;李锡祚;安纪霞;;双语对齐技术在双语教学词典自动编纂中的应用[J];计算机与数字工程;2007年11期
4 王厚峰;基于实例的机器翻译——方法和问题[J];术语标准化与信息技术;2003年02期
5 热西旦木·塔依;吐尔根·依布拉音;;汉文-维吾尔文双语对齐语料库构建的实验性研究[J];伊犁师范学院学报(自然科学版);2008年04期
6 吕学强,陈文亮,姚天顺;基于连接文法的双语E-Chunk获取方法[J];东北大学学报(自然科学版);2002年09期
7 陈博兴,杜利民;基于双语语料的单个源语词汇和目标语多词单元的对齐[J];中文信息学报;2003年01期
8 李文刚;周杰;杨保群;;基于词典和句长及位置的双语对齐方法的改进[J];现代电子技术;2011年14期
9 孙越恒;段楠;侯越先;;统计机器翻译中的非连续短语模板抽取及其应用[J];计算机科学;2009年10期
10 廖剑;李玉鑑;;基于句子比较的英汉翻译模板自动提取算法[J];计算机工程与应用;2006年25期
11 热西旦·塔依;吐尔根·依布拉音;;汉文-维吾尔文双语语料库中段落对齐技术研究[J];新疆大学学报(自然科学版);2010年01期
12 王丽;韩习武;;双语词典在统计机器翻译中的应用[J];计算机工程与应用;2010年16期
13 任高举;吐尔根·伊布拉音;艾山·吾买尔;;统计机器翻译中汉维短语对抽取的研究[J];新疆大学学报(自然科学版);2010年03期
14 刘凯;乌日力嘎;斯钦图;姜文斌;刘群;;基于双语约束的蒙古语无监督依存分析[J];中文信息学报;2011年04期
15 雷刚;冷荣秋;林思扬;;一种计算机领域英汉双语语料库平台的构建[J];科技广场;2009年09期
16 叶娜;陈小芳;蔡东风;;面向专利文献的术语自动处理技术[J];沈阳航空工业学院学报;2010年04期
17 金澎;吴云芳;俞士汶;;词义标注语料库建设综述[J];中文信息学报;2008年03期
18 李英;吐尔根·依布拉音;;双语句子对齐算法分析[J];现代计算机(专业版);2008年12期
19 热西旦·塔依;吐尔根·依布拉音;;汉文-维吾尔文双语语料库中基于词典译文的句子对齐方法研究[J];新疆大学学报(自然科学版);2009年03期
20 夏朝晖;计算技术类期刊论文题名中的“基于”及其相应英文译法[J];编辑学报;2005年01期
中国重要会议论文全文数据库 前10条
1 吐尔根·依布拉音;阿里甫·库尔班维尼拉·木沙江;;面向汉维机器翻译的双语对齐语料库设计与实现[A];第十届全国少数民族语言文字信息处理学术研讨会论文集[C];2005年
2 陈博兴;杜利民;;基于双语语料的单个源语词汇和目标语多词单元的对齐[A];第一届学生计算语言学研讨会论文集[C];2002年
3 周威;万康;刘志杰;;英汉双语自动对齐混合算法[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
4 牟小峰;;面向英汉机器翻译的树库建设[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
5 热西旦·塔依;加米拉·吾守尔;吐尔根·依布拉音;;汉文-维吾尔文双语对齐语料库的实验性研究[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年
6 常宝宝;肖华云;;面向语言学家和词典编纂专家的汉英双语语料库检索系统[A];2004年辞书与数字化研讨会论文集[C];2004年
7 程葳;邱立坤;;限定领域汉英口语双语语块库的构建[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
8 毕雪华;吐尔根·依布拉音;;面向汉维机器翻译的双语对齐语料库的构建[A];第十届全国少数民族语言文字信息处理学术研讨会论文集[C];2005年
9 诺明花;张立强;刘汇丹;吴健;丁治明;;汉藏短语抽取[A];第五届全国青年计算语言学研讨会论文集[C];2010年
10 王洪俊;施水才;俞士汶;肖诗斌;;跨语言文档对齐[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
中国硕士学位论文全文数据库 前10条
1 彭焱;双语对齐软件人机交互用户界面的可用性评估[D];浙江师范大学;2013年
2 刘飞;双语平行句对的获取与语料库的建立[D];哈尔滨工业大学;2013年
3 牟小峰;面向英汉机器翻译的树库建设[D];北京语言大学;2007年
4 牛洪梅;服务于汉维机器翻译系统的双语句子对齐的研究[D];新疆大学;2007年
5 陈相;面向生物医学领域的双语对齐技术研究[D];大连理工大学;2009年
6 奥香兰;翻译记忆库的建设与维护[D];上海外国语大学;2012年
7 东智布加;面向双语平行语料库的英藏句子结构研究[D];西北民族大学;2011年
8 哈乐;基于实例的汉阿语言机器翻译系统的研究与实现[D];长安大学;2012年
9 艾厚军;双语语料获取系统关键技术的研究与实现[D];电子科技大学;2012年
10 应玉龙;汉蒙词法分析及其在统计机器翻译中的应用[D];中国科学技术大学;2010年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978