收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

英文地址图像识别与翻译研究

屠晓  
【摘要】:经济全球化的发展推进了国际信函的广泛使用,从国外寄达中国国内的信函业务量迅猛增长。这类信函的收信人地址一般是用英文书写的,为了保证投递的效率和质量,邮局专业人员需要将英文表述的收信人地址翻译成中文并批注到信封上。省会级城市的邮局每天的国际信函处理量达5万件且逐年递增。如何实现英文地址自动翻译成为邮政自动化的一个重要课题。成熟的字符识别技术以及蓬勃发展的机器翻译技术为此提供了可行的技术平台。 本文提出的英文地址自动翻译系统是以信封图像为处理对象,采用文本图像分割方法和字符识别技术获取信封图像上用英文书写的地址内容,并自动将其翻译成中文地址的邮政自动化系统。英文地址图像识别和翻译涉及文本图像处理、自然语言处理、机器翻译、数据挖掘、人工智能等多个学科领域,是字符识别技术和机器翻译技术的有效结合。本文有以下研究成果: 根据信封图像的特点,提出基于灰度梯度连续变化特征的窗口定位法,以及复杂背景下基于连通元特征的地址文字定位法。这两种方法的组合有效地将收信人地址区域从信封图像区分离出来。本文还提出一种基于游程的快速连通元标记方法,大大加快连通元的处理速度,仅需扫描图像一次即可获得连通元的相关信息。 提出一种基于最大匹配算法的地址理解方法,以及一种基于柔性字符串匹配和有限自动机的地址理解(FPMDFA)方法,对识别得到的地址文本进行分析和理解,从中将路名、楼宇、居民区、门牌号、公司或者收件人等地址信息提取出来。实验结果表明基于最大匹配算法的地址理解方法获得的结果正确率高,而FPMDFA方法则在有OCR识别错误的情况下能提取更多的地址信息。 运用变精度粗糙集理论,提出一种基于属性核的βDP区间约简的消歧规则挖掘方法,即采用基于属性核的βDP区间约简算法对决策表的条件属性进行约简,然后再生成相关的消歧规则。该方法在一定程度上避免了基于经典粗糙集理论的挖掘方法对分类数据正确性要求高、不利于规则泛化的缺点,既有利于从决策表中提取共性规则,也便于得到单独情况的个性规则,同时让规则的正确性可控。 提出一种基于块距离的柔性字符串匹配方法。即在计算一个字符串通过删除、插入和替换编辑成另一个字符串的步骤时,将子串的移动也作为编辑操作的一种。这解决了如何度量两个含义一致但词序不同的地址之间的相似性问题。实验表明运用柔性字符串匹配方法度量地址和地址之间的相似性有效地降低了字符识别错误对系统造成的影响,提高了系统的容错性。 集成上述成果开发的英文地址自动翻译系统已经在上海邮政速递局的外信批译环节得到成功应用和推广,产生了良好的经济和社会效应。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 罗智勇,李在铭,傅治中;红外双色亚图像识别研究[J];系统工程与电子技术;2000年11期
2 封举富;石青云;;基于活动原点的仿射匹配方法[J];模式识别与人工智能;2000年03期
3 张艳辉 ,孙以材;图像识别在四探针测试技术中的应用[J];电子产品世界;2004年03期
4 王福亮;基于神经网络的基板引脚图像识别软件[J];机械工程师;2004年01期
5 王福亮,严珩志;一种基于神经网络的基板引脚图像识别方法[J];计算机工程与应用;2004年12期
6 黄外斌,张亶,陈刚;基于边界和梯度特征的图像识别[J];计算机工程;2004年09期
7 高娜,陶慧;Matlab在数字图像处理中的应用[J];荆门职业技术学院学报;2005年06期
8 许开宇,徐志京,郑华耀;小波变换在电子海图矢量化中的应用[J];上海海事大学学报;2005年03期
9 张同艳;张爱梅;张建华;;对玻璃缺陷进行选择性轮廓跟踪方法的研究[J];电脑知识与技术(学术交流);2007年07期
10 杜铭;宫芳;吴锐;;一种有效的纸币识别预处理方法[J];黑龙江科技信息;2008年24期
11 陈玉萍;苏博;;摄影测量中标记点编码与解码的方法[J];技术与创新管理;2009年04期
12 刘建友;李宝树;仝卫国;;航拍绝缘子图像的提取和识别[J];传感器世界;2009年12期
13 徐旭;胡玲玲;徐江;;物联网环境下RFID技术在世博会园区车辆安全监管系统中的应用设计[J];警察技术;2010年06期
14 王青荣;李晓芬;潘福成;;烟厂制丝线监测终端系统设计[J];微计算机信息;2010年28期
15 李宏,薛冰,杨英科,左少平,谢虹;一个具有自动输入功能的电路CAD系统[J];造船技术;1998年07期
16 宋晓霞;计算机教学中应强调的几种图像处理方法[J];雁北师范学院学报;2003年03期
17 杨彪;IC芯片表面标识自动识别虚拟仪器系统[J];电子技术;2004年12期
18 业宁;王厚立;徐兆军;丁建文;;基于支持向量机的木材缺陷识别[J];计算机应用与软件;2006年04期
19 罗晓萍;蒋加伏;唐贤瑛;;基于SVM和模糊免疫网络的交通标志图像识别[J];计算机工程与设计;2006年09期
20 陈波;杨阳;沈田双;;一种基于不变矩和SVM的图像目标识别方法[J];仪器仪表学报;2006年S3期
中国重要会议论文全文数据库 前10条
1 姚天顺;杨莹;;关于机器翻译的评测问题[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
2 奚宁;赵迎功;汤光超;李中华;刘友强;戴新宇;陈家骏;;南京大学第七届机器翻译研讨会评测技术报告[A];机器翻译研究进展——第七届全国机器翻译研讨会论文集[C];2011年
3 何彦青;石崇德;于薇;张均胜;王惠临;;中国科学技术信息研究所CWMT'2011技术报告[A];机器翻译研究进展——第七届全国机器翻译研讨会论文集[C];2011年
4 梁芳丽;陈雷;李淼;何绵涛;刘绘;;第七届全国机器翻译研讨会中科院智能所评测技术报告[A];机器翻译研究进展——第七届全国机器翻译研讨会论文集[C];2011年
5 希夏姆.马利克;;汉阿机译研究(一) 从汉语单句若干结构谈论汉阿机译[A];辉煌二十年——中国中文信息学会二十周年学术会议论文集[C];2001年
6 肖桐;张浩;李强;路琦;朱靖波;任飞亮;王会珍;;CWMT2011东北大学参评系统NiuTrans介绍(英文)[A];机器翻译研究进展——第七届全国机器翻译研讨会论文集[C];2011年
7 麦热哈巴.艾力;米日古.肉孜;撒依达;江阿古丽;吐尔根.伊布拉音;;新疆大学CWMT2011评测技术报告[A];机器翻译研究进展——第七届全国机器翻译研讨会论文集[C];2011年
8 周玉;翟飞飞;张家俊;涂眉;陈钰枫;宗成庆;;多语言文本机器翻译系统——中科院自动化所CWMT2011评测技术报告[A];机器翻译研究进展——第七届全国机器翻译研讨会论文集[C];2011年
9 李贤华;郑仲光;孟遥;于浩;;第七届全国机器翻译研讨会(CWMT2011)富士通研究开发中心技术报告[A];机器翻译研究进展——第七届全国机器翻译研讨会论文集[C];2011年
10 赵红梅;吕雅娟;贲国生;黄云;刘群;;第七届全国机器翻译研讨会(CWMT2011)评测报告[A];机器翻译研究进展——第七届全国机器翻译研讨会论文集[C];2011年
中国博士学位论文全文数据库 前10条
1 屠晓;英文地址图像识别与翻译研究[D];华东师范大学;2011年
2 王宇新;基于特征分布的图像识别方法研究与应用[D];大连理工大学;2012年
3 王斯日古楞;基于混合策略的汉蒙机器翻译及相关技术研究[D];内蒙古大学;2009年
4 翟俊海;基于小波变换和模糊粗糙集技术的图像识别[D];河北大学;2010年
5 刘宇鹏;机器翻译中系统融合技术的研究[D];哈尔滨工业大学;2011年
6 任飞亮;高适应性基于实例的机器翻译中关键技术研究[D];东北大学;2008年
7 胡新宇;基于机器视觉的家蚕微粒子图像识别方法的研究[D];武汉理工大学;2011年
8 林勇;基于振动谱图像识别的故障诊断方法研究[D];浙江大学;2009年
9 罗刚银;全自动血型分析系统关键技术的研究[D];中国科学院研究生院(长春光学精密机械与物理研究所);2012年
10 李杰;隐马尔可夫模型的研究及其在图像识别中的应用[D];清华大学;2004年
中国硕士学位论文全文数据库 前10条
1 崔春雷;军用自动报靶系统中图像识别技术的研究[D];大连海事大学;2004年
2 龚文勇;改进的基于光照方向的虚假图像识别[D];吉林大学;2010年
3 刘胜强;纸卷数字化和图像识别在网上阅卷中的应用[D];电子科技大学;2010年
4 王睿;基于图像识别与匹配技术的奶牛保险系统研究[D];内蒙古大学;2011年
5 王相维;基于图像识别技术的结构位移监测系统的开发和应用[D];南京理工大学;2009年
6 甘洪泉;基于嵌入式视频监控系统的指针识别[D];华北电力大学(北京);2004年
7 刘栋嫣;基于图像识别技术的智能点钞机设计[D];哈尔滨理工大学;2005年
8 白洁;视频监控网络图像系统研究与实现[D];西北工业大学;2004年
9 董辉;基于神经网络的图像识别系统的研究及实现[D];西南农业大学;2005年
10 熊辉;基于模板匹配的金刚石颗粒图像识别[D];四川大学;2005年
中国重要报纸全文数据库 前10条
1 记者 李红;法研究出图像识别软件[N];科技日报;2000年
2 凌子浪;机器翻译的未来不可估量[N];计算机世界;2001年
3 《中国电脑教育报》记者 晨风;机器翻译如何是好?[N];中国电脑教育报;2001年
4 记者 张兆军通讯员 郑原驰;图像识别混合交通控制系统问世[N];科技日报;2008年
5 赵迎华;机器翻译如何是好[N];光明日报;2001年
6 ;机器翻译在电子政务系统建设中的应用[N];中国电脑教育报;2004年
7 ;机器翻译 在电子政务系统建设中的应用[N];中国电脑教育报;2004年
8 刘 莎;语义约定全文翻译: 机器翻译的“日心说”?[N];计算机世界;2002年
9 本报记者 李彬;手机变搜索引擎[N];科技日报;2006年
10 海言;慧视:让电脑“识文断字”[N];科技日报;2007年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978