收藏本站
《华东师范大学》 2011年
收藏 | 手机打开
二维码
手机客户端打开本文

英文地址图像识别与翻译研究

屠晓  
【摘要】:经济全球化的发展推进了国际信函的广泛使用,从国外寄达中国国内的信函业务量迅猛增长。这类信函的收信人地址一般是用英文书写的,为了保证投递的效率和质量,邮局专业人员需要将英文表述的收信人地址翻译成中文并批注到信封上。省会级城市的邮局每天的国际信函处理量达5万件且逐年递增。如何实现英文地址自动翻译成为邮政自动化的一个重要课题。成熟的字符识别技术以及蓬勃发展的机器翻译技术为此提供了可行的技术平台。 本文提出的英文地址自动翻译系统是以信封图像为处理对象,采用文本图像分割方法和字符识别技术获取信封图像上用英文书写的地址内容,并自动将其翻译成中文地址的邮政自动化系统。英文地址图像识别和翻译涉及文本图像处理、自然语言处理、机器翻译、数据挖掘、人工智能等多个学科领域,是字符识别技术和机器翻译技术的有效结合。本文有以下研究成果: 根据信封图像的特点,提出基于灰度梯度连续变化特征的窗口定位法,以及复杂背景下基于连通元特征的地址文字定位法。这两种方法的组合有效地将收信人地址区域从信封图像区分离出来。本文还提出一种基于游程的快速连通元标记方法,大大加快连通元的处理速度,仅需扫描图像一次即可获得连通元的相关信息。 提出一种基于最大匹配算法的地址理解方法,以及一种基于柔性字符串匹配和有限自动机的地址理解(FPMDFA)方法,对识别得到的地址文本进行分析和理解,从中将路名、楼宇、居民区、门牌号、公司或者收件人等地址信息提取出来。实验结果表明基于最大匹配算法的地址理解方法获得的结果正确率高,而FPMDFA方法则在有OCR识别错误的情况下能提取更多的地址信息。 运用变精度粗糙集理论,提出一种基于属性核的βDP区间约简的消歧规则挖掘方法,即采用基于属性核的βDP区间约简算法对决策表的条件属性进行约简,然后再生成相关的消歧规则。该方法在一定程度上避免了基于经典粗糙集理论的挖掘方法对分类数据正确性要求高、不利于规则泛化的缺点,既有利于从决策表中提取共性规则,也便于得到单独情况的个性规则,同时让规则的正确性可控。 提出一种基于块距离的柔性字符串匹配方法。即在计算一个字符串通过删除、插入和替换编辑成另一个字符串的步骤时,将子串的移动也作为编辑操作的一种。这解决了如何度量两个含义一致但词序不同的地址之间的相似性问题。实验表明运用柔性字符串匹配方法度量地址和地址之间的相似性有效地降低了字符识别错误对系统造成的影响,提高了系统的容错性。 集成上述成果开发的英文地址自动翻译系统已经在上海邮政速递局的外信批译环节得到成功应用和推广,产生了良好的经济和社会效应。
【学位授予单位】:华东师范大学
【学位级别】:博士
【学位授予年份】:2011
【分类号】:TP391.2;TP391.41

免费申请
【参考文献】
中国期刊全文数据库 前10条
1 苗夺谦,胡桂荣;知识约简的一种启发式算法[J];计算机研究与发展;1999年06期
2 王加阳;陈松乔;罗安;;可变精度粗集模型约简异常分析[J];计算机科学;2005年12期
3 张素智;刘放美;;基于矩阵约束法的中文分词研究[J];计算机工程;2007年15期
4 王加阳;谢颖;;基于量子粒子群优化的最小属性约简算法[J];计算机工程;2009年12期
5 徐燕,怀进鹏,王兆其;基于区分能力大小的启发式约简算法及其应用[J];计算机学报;2003年01期
6 何克抗,徐辉,孙波;书面汉语自动分词专家系统设计原理[J];中文信息学报;1991年02期
7 徐秉铮,詹剑,贺前华;基于神经网络的分词方法[J];中文信息学报;1993年02期
8 黄昌宁;赵海;;中文分词十年回顾[J];中文信息学报;2007年03期
9 熊德意;刘群;林守勋;;基于句法的统计机器翻译综述[J];中文信息学报;2008年02期
10 张文修,吴伟志;粗糙集理论介绍和研究综述[J];模糊系统与数学;2000年04期
【共引文献】
中国期刊全文数据库 前10条
1 于海涛;Rough集理论在数据约简中的应用[J];安徽教育学院学报;2004年03期
2 徐文婷;李承鹏;;基于自适应遗传算法的离散化方法[J];合肥师范学院学报;2011年03期
3 程家兴,钱付兰;粗糙集方法在基于属性分类中的应用[J];安徽大学学报(自然科学版);2005年01期
4 蔡莉;胡学钢;;一种基于粗集的决策表求核算法[J];安徽大学学报(自然科学版);2007年06期
5 周玉华;李景杰;;不完备决策表的一种属性约简方法[J];安徽大学学报(自然科学版);2009年04期
6 杨萍,杨明;基于VPRS的重要属性评价方法研究[J];安徽工程科技学院学报(自然科学版);2003年01期
7 杨萍,万上海,陈耿;一种基于可变支持度的缺省规则挖掘算法[J];安徽工程科技学院学报(自然科学版);2004年02期
8 孙全玲;基于粗集和神经网络的建模方法研究[J];安徽建筑工业学院学报(自然科学版);2005年02期
9 孙虹;方敏;;基于Rough集和RBF网络的车牌字符识别方法[J];安徽建筑工业学院学报(自然科学版);2006年04期
10 孙虹;;粗糙集神经网络系统在车牌字符识别中的研究[J];安徽建筑工业学院学报(自然科学版);2007年04期
中国重要会议论文全文数据库 前10条
1 危前进;董荣胜;孟瑜;崔更申;;基于粗糙集的机械装配知识发现方法[A];广西计算机学会25周年纪念会暨2011年学术年会论文集[C];2011年
2 ;Fuzziness in Covering Generalized Rough Sets[A];第二十六届中国控制会议论文集[C];2007年
3 李雄;党生;;基于Rough集理论的战场侦察情报处理[A];第二十六届中国控制会议论文集[C];2007年
4 陈保家;李力;赵新泽;;基于尺度-小波能量谱、粗糙集和神经网络集成的内燃机故障诊断方法[A];第二十六届中国控制会议论文集[C];2007年
5 方炜炜;杨炳儒;彭珍;;一种基于粗糙集的启发式属性归约的新算法[A];第二十七届中国控制会议论文集[C];2008年
6 陈楚湘;沈建京;陈冰;尚长兴;王运成;;运用粗糙集理论建立中老年肺炎中医症候诊断标准[A];第二十九届中国控制会议论文集[C];2010年
7 龚锦红;杨辉;衷路生;;稀土萃取分离过程的Rough集案例推理方法[A];第二十九届中国控制会议论文集[C];2010年
8 ;Influence Diagram Based on Rough Set Theory[A];第二十九届中国控制会议论文集[C];2010年
9 ;The Prediction of Soil Moisture Based on Rough Set-Neural Network Model[A];第二十九届中国控制会议论文集[C];2010年
10 陈楚湘;沈建京;陈冰;尚长兴;王运成;;运用粗糙集理论和Apriori算法建立中医症候诊断标准[A];中国自动化学会控制理论专业委员会D卷[C];2011年
中国博士学位论文全文数据库 前10条
1 殷志伟;基于统计学习理论的分类方法研究[D];哈尔滨工程大学;2009年
2 姜延吉;多传感器数据融合关键技术研究[D];哈尔滨工程大学;2010年
3 杨锦园;基于传感器管理的移动机器人融合算法研究[D];华中科技大学;2010年
4 张目;高技术企业信用风险影响因素及评价方法研究[D];电子科技大学;2010年
5 苏煜;基于SCF范式的在线P300脑机接口研究[D];浙江大学;2010年
6 郭戈;数字视频语义信息提取与分析[D];解放军信息工程大学;2010年
7 温世亿;膨胀土渠坡若干关键技术问题研究[D];武汉大学;2010年
8 黄正行;临床过程分析与优化技术研究[D];浙江大学;2010年
9 戴小鹏;知识网格及其在农业生物灾害预警中关键技术研究[D];湖南农业大学;2010年
10 朱佳俊;不确定可拓群决策优化方法及应用[D];东华大学;2010年
中国硕士学位论文全文数据库 前10条
1 罗义兵;领域文本相似度计算方法研究[D];山东科技大学;2010年
2 岳海亮;信息论在粗糙集连续属性离散化中的应用[D];辽宁师范大学;2010年
3 冯海瑛;《万历野获编》分词理论与实践[D];广西师范学院;2010年
4 张晓冬;基于全矢谱的智能诊断技术研究[D];郑州大学;2010年
5 李昕哲;关系邻域系统的属性约简[D];郑州大学;2010年
6 刘琪;正态云模型模糊推理系统及其应用研究[D];郑州大学;2010年
7 张燕丽;基于Winnow算法和CAPTCHA的垃圾短信过滤研究[D];郑州大学;2010年
8 周霞;基于粗糙集的电子商务交易知识获取研究[D];哈尔滨工程大学;2010年
9 冯为军;基于粗糙集理论的数据挖掘算法的研究[D];哈尔滨工程大学;2010年
10 白喜朋;基于作业的钢铁企业成本分析[D];大连理工大学;2010年
【二级参考文献】
中国期刊全文数据库 前10条
1 孙茂松,邹嘉彦;汉语自动分词研究评述[J];当代语言学;2001年01期
2 苗夺谦,胡桂荣;知识约简的一种启发式算法[J];计算机研究与发展;1999年06期
3 李莉;;基于可变精度粗集模型的增量式归纳学习[J];计算机科学;1999年01期
4 张滨,晏蒲柳,李文翔,夏德麟;基于汉语句模的中文分词算法[J];计算机工程;2004年01期
5 佘莉,符红光,方海光;几何命题处理中的中文分词技术[J];计算机工程;2005年18期
6 王珏,王任,苗夺谦,郭萌,阮永韶,袁小红,赵凯;基于Rough Set理论的“数据浓缩”[J];计算机学报;1998年05期
7 廖建坤;叶东毅;;基于免疫粒子群优化的最小属性约简算法[J];计算机应用;2007年03期
8 韩祯祥,张琦,文福拴;粗糙集理论及其应用综述[J];控制理论与应用;1999年02期
9 梁南元;书面汉语自动分词系统—CDWS[J];中文信息学报;1987年02期
10 揭春雨 ,刘源 ,梁南元;论汉语自动分词方法[J];中文信息学报;1989年01期
【相似文献】
中国期刊全文数据库 前10条
1 罗智勇,李在铭,傅治中;红外双色亚图像识别研究[J];系统工程与电子技术;2000年11期
2 封举富;石青云;;基于活动原点的仿射匹配方法[J];模式识别与人工智能;2000年03期
3 张艳辉 ,孙以材;图像识别在四探针测试技术中的应用[J];电子产品世界;2004年03期
4 王福亮;基于神经网络的基板引脚图像识别软件[J];机械工程师;2004年01期
5 王福亮,严珩志;一种基于神经网络的基板引脚图像识别方法[J];计算机工程与应用;2004年12期
6 黄外斌,张亶,陈刚;基于边界和梯度特征的图像识别[J];计算机工程;2004年09期
7 高娜,陶慧;Matlab在数字图像处理中的应用[J];荆门职业技术学院学报;2005年06期
8 许开宇,徐志京,郑华耀;小波变换在电子海图矢量化中的应用[J];上海海事大学学报;2005年03期
9 张同艳;张爱梅;张建华;;对玻璃缺陷进行选择性轮廓跟踪方法的研究[J];电脑知识与技术(学术交流);2007年07期
10 杜铭;宫芳;吴锐;;一种有效的纸币识别预处理方法[J];黑龙江科技信息;2008年24期
中国重要会议论文全文数据库 前10条
1 姚天顺;杨莹;;关于机器翻译的评测问题[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
2 奚宁;赵迎功;汤光超;李中华;刘友强;戴新宇;陈家骏;;南京大学第七届机器翻译研讨会评测技术报告[A];机器翻译研究进展——第七届全国机器翻译研讨会论文集[C];2011年
3 何彦青;石崇德;于薇;张均胜;王惠临;;中国科学技术信息研究所CWMT'2011技术报告[A];机器翻译研究进展——第七届全国机器翻译研讨会论文集[C];2011年
4 梁芳丽;陈雷;李淼;何绵涛;刘绘;;第七届全国机器翻译研讨会中科院智能所评测技术报告[A];机器翻译研究进展——第七届全国机器翻译研讨会论文集[C];2011年
5 希夏姆.马利克;;汉阿机译研究(一) 从汉语单句若干结构谈论汉阿机译[A];辉煌二十年——中国中文信息学会二十周年学术会议论文集[C];2001年
6 肖桐;张浩;李强;路琦;朱靖波;任飞亮;王会珍;;CWMT2011东北大学参评系统NiuTrans介绍(英文)[A];机器翻译研究进展——第七届全国机器翻译研讨会论文集[C];2011年
7 麦热哈巴.艾力;米日古.肉孜;撒依达;江阿古丽;吐尔根.伊布拉音;;新疆大学CWMT2011评测技术报告[A];机器翻译研究进展——第七届全国机器翻译研讨会论文集[C];2011年
8 周玉;翟飞飞;张家俊;涂眉;陈钰枫;宗成庆;;多语言文本机器翻译系统——中科院自动化所CWMT2011评测技术报告[A];机器翻译研究进展——第七届全国机器翻译研讨会论文集[C];2011年
9 李贤华;郑仲光;孟遥;于浩;;第七届全国机器翻译研讨会(CWMT2011)富士通研究开发中心技术报告[A];机器翻译研究进展——第七届全国机器翻译研讨会论文集[C];2011年
10 赵红梅;吕雅娟;贲国生;黄云;刘群;;第七届全国机器翻译研讨会(CWMT2011)评测报告[A];机器翻译研究进展——第七届全国机器翻译研讨会论文集[C];2011年
中国重要报纸全文数据库 前10条
1 记者 李红;法研究出图像识别软件[N];科技日报;2000年
2 凌子浪;机器翻译的未来不可估量[N];计算机世界;2001年
3 《中国电脑教育报》记者 晨风;机器翻译如何是好?[N];中国电脑教育报;2001年
4 记者 张兆军通讯员 郑原驰;图像识别混合交通控制系统问世[N];科技日报;2008年
5 赵迎华;机器翻译如何是好[N];光明日报;2001年
6 ;机器翻译在电子政务系统建设中的应用[N];中国电脑教育报;2004年
7 ;机器翻译 在电子政务系统建设中的应用[N];中国电脑教育报;2004年
8 刘 莎;语义约定全文翻译: 机器翻译的“日心说”?[N];计算机世界;2002年
9 本报记者 李彬;手机变搜索引擎[N];科技日报;2006年
10 海言;慧视:让电脑“识文断字”[N];科技日报;2007年
中国博士学位论文全文数据库 前10条
1 屠晓;英文地址图像识别与翻译研究[D];华东师范大学;2011年
2 王宇新;基于特征分布的图像识别方法研究与应用[D];大连理工大学;2012年
3 王斯日古楞;基于混合策略的汉蒙机器翻译及相关技术研究[D];内蒙古大学;2009年
4 翟俊海;基于小波变换和模糊粗糙集技术的图像识别[D];河北大学;2010年
5 刘宇鹏;机器翻译中系统融合技术的研究[D];哈尔滨工业大学;2011年
6 任飞亮;高适应性基于实例的机器翻译中关键技术研究[D];东北大学;2008年
7 胡新宇;基于机器视觉的家蚕微粒子图像识别方法的研究[D];武汉理工大学;2011年
8 林勇;基于振动谱图像识别的故障诊断方法研究[D];浙江大学;2009年
9 罗刚银;全自动血型分析系统关键技术的研究[D];中国科学院研究生院(长春光学精密机械与物理研究所);2012年
10 李杰;隐马尔可夫模型的研究及其在图像识别中的应用[D];清华大学;2004年
中国硕士学位论文全文数据库 前10条
1 崔春雷;军用自动报靶系统中图像识别技术的研究[D];大连海事大学;2004年
2 龚文勇;改进的基于光照方向的虚假图像识别[D];吉林大学;2010年
3 刘胜强;纸卷数字化和图像识别在网上阅卷中的应用[D];电子科技大学;2010年
4 王睿;基于图像识别与匹配技术的奶牛保险系统研究[D];内蒙古大学;2011年
5 王相维;基于图像识别技术的结构位移监测系统的开发和应用[D];南京理工大学;2009年
6 甘洪泉;基于嵌入式视频监控系统的指针识别[D];华北电力大学(北京);2004年
7 刘栋嫣;基于图像识别技术的智能点钞机设计[D];哈尔滨理工大学;2005年
8 白洁;视频监控网络图像系统研究与实现[D];西北工业大学;2004年
9 董辉;基于神经网络的图像识别系统的研究及实现[D];西南农业大学;2005年
10 熊辉;基于模板匹配的金刚石颗粒图像识别[D];四川大学;2005年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026