收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

低质量文本图像OCR技术的研究

孙羽菲  
【摘要】: 本论文对低质量文本图像的OCR技术进行了深入的研究,目标就是从理论,算法和应用三个层次上研究低质量文本图像的高性能识别问题。研究工作主要包括以下几个方面: 首先分析论述了低质量文本灰度图像条件下,文字识别与人的认知、经典人工智能问题、以及二值图像识别技术之间的关系,对低质量文本图像OCR技术的研究方向提出了有别于传统的观点和看法。 在上述理论框架的指导下,结合低质量文本自身的特点和规律,设计了一个低质量文本图像的识别流程,并在各主要步骤给出了实用高效的算法,主要有: 基于连通区域的层次结构切分算法:不同于传统的先行列切分,再字切分的算法过程,本方法采用了由小到大、自底向上的切分策略。通过连通区域特征的变化规律找出适用于切分的最佳阈值,再根据先验知识和启发式规则,对连通区域做适当的合并分割操作,最后得到最优的切分结果。实验表明,该方法对于低质量文本图像能够取得令人满意的切分效果。 基于地形特征的种子区域增长算法:基于确定点和关键点概念,利用像素地形特征自动的选择种子点,通过一种改进的种子区域增长方法,从种子区域开始,依据一定的优先级规则,逐渐向其近邻点扩展,对单字灰度图像二值化,有效地获取了字符的结构信息。本方法与已有的二值化方法相比较,能够更好的保留有效的字符结构信息,提高了识别的正确率。 基于不对称性的分类部分空间法:发现了相似字之间误识的不对称性,并对这种不对称现象的成因进行了细致的探讨和分析。基于这种不对称性,提出了一种分类部分空间方法来解决相似字的识别问题。相似字按其结构特点被分成若干基本类别,不同类别在相应的部分空间提取不同的特征进行比较,以达到正确识别相似字的目的。 经百万字左右的文本测试表明,本文提出的方法对于不同质量文本的识别性能有不同程度的提高,尤其是对于质量比较低的文本(五十年代的文本数据),其识别正确率达


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 孔丽红;游晓明;;地图扫描影像中文字自动提取的方法研究[J];电脑知识与技术;2011年22期
2 谢正祥;刘玉红;王志芳;王颖;李虹;吴少波;;图像的带参数二值化方法[J];中国医学物理学杂志;2007年02期
3 范红月;顾颖;;新型图书馆用条码识别设备研究[J];图书馆学研究;2007年03期
4 季晨光;张晓宇;白相宇;;基于视频图像中的车型识别[J];辽宁工业大学学报(自然科学版);2010年01期
5 胡涛;;模式识别在大米品质检测中的应用[J];农业网络信息;2010年10期
6 闫宏;张兴周;刘晓瑞;;基于特征脸的人脸识别系统[J];应用科技;2007年04期
7 吴志攀;;一种车型识别的预处理实现方案[J];计算机时代;2008年02期
8 孔华锋;鲁宏伟;胡东红;;基于改进Radon变换的芯片几何特征检测[J];计算机工程;2008年10期
9 王立强;;车牌自动识别技术的算法与实践[J];廊坊师范学院学报(自然科学版);2010年04期
10 赵仕波,余艳梅,罗峰,左航;工程记录曲线的自动提取和数字恢复[J];成都理工大学学报(自然科学版);2005年04期
11 李永尧;郑陈婷;王晓明;;基于数字图像的天气系统识别[J];福建师范大学学报(自然科学版);2009年02期
12 桑红石,傅勇,张天序,刘云生;基于标记信息的快速轮廓跟踪算法[J];华中科技大学学报(自然科学版);2005年09期
13 徐全生,于霞,梁乐彬;汽车牌照图像的预处理研究[J];沈阳工业大学学报;2002年02期
14 胡建明;吴立德;;一种改进的文字/图形图像的快速分割算法[J];模式识别与人工智能;2001年02期
15 胡东红,谭辉,陈莘萌;Radon变换在二维条码图像识别中的应用[J];武汉大学学报(理学版);2005年05期
16 金海坤;杜文杰;沙俐敏;;基于CAPTCHA的中文安全机制的研究[J];计算机工程与设计;2006年06期
17 何晓昀;;银行、保险行业单证扫描系统中条形码识别软件的开发[J];华南金融电脑;2007年08期
18 唐博;牛秦洲;;玻璃瓶凸性字符的快速投影模板匹配[J];长春工业大学学报(自然科学版);2007年04期
19 叶常青;马世雄;阚秀;;数学形态学及骨骼化方法在重迭细胞图像识别中的应用[J];计算机应用与软件;1993年03期
20 张志龙;沈振康;李吉成;;一组基于广义局部沃尔什变换的纹理特征[J];电子与信息学报;2006年06期
中国重要会议论文全文数据库 前10条
1 王铌;于新生;唐颖;;基于图像处理的浮游生物识别方法研究[A];第十二届全国图象图形学学术会议论文集[C];2005年
2 徐伟钧;姚萌;;基于位置系统的图像预处理[A];第六届全国信息获取与处理学术会议论文集(2)[C];2008年
3 陈运文;王逸飞;;一种用于印鉴自动鉴别的几何统计方法[A];第十二届全国图象图形学学术会议论文集[C];2005年
4 陈静;徐丹;;一种去除灰度及彩色图像随机噪声的方法[A];第十四届全国图象图形学学术会议论文集[C];2008年
5 付炜;张金艳;;基于BP神经网络的车牌定位方法的研究[A];2009年中国高校通信类院系学术研讨会论文集[C];2009年
6 付炜;张金艳;;基于BP神经网络的车牌定位方法的研究[A];中国电子学会第十六届信息论学术年会论文集[C];2009年
7 马宪民;蒋勇;卜祥莉;;基于图像处理的煤矸石自动分选系统的研究[A];2003年中国智能自动化会议论文集(下册)[C];2003年
8 吴闻;刘秉瀚;方秀端;;肾小球自动检出[A];全国第十五届计算机科学与技术应用学术会议论文集[C];2003年
9 朱成杰;张圣芹;欧阳名三;高俊岭;梁喆;;基于嵌入式技术的高速公路收费系统的研究[A];2009年中国智能自动化会议论文集(第三分册)[C];2009年
10 马宪民;蒋勇;;煤与矸石识别的数字图像处理方法探讨[A];中国煤炭学会煤矿机电一体化专业委员会、中国电工技术学会煤矿电工专业委员会2004年学术年会论文集[C];2004年
中国博士学位论文全文数据库 前10条
1 孙羽菲;低质量文本图像OCR技术的研究[D];中国科学院研究生院(计算技术研究所);2005年
2 郑晓东;基于样条模板滤波和双函数法的车牌自动识别[D];华中科技大学;2007年
3 杨异秉;二维随机共振理论及其在图像处理中的应用[D];浙江大学;2011年
4 孙鹏;基于图像处理的氧化铝回转窑烧结工况识别系统研究[D];东北大学;2009年
5 鲁绯;腐乳发酵机理、品质改进和模式识别研究[D];中国农业大学;2005年
6 程昌秀;3S技术在县级土地利用变更调查中的应用研究[D];中国农业大学;2001年
7 刘云鹏;电力变压器局部放电的电气定位及诊断[D];华北电力大学(河北);2005年
8 游峰;智能车辆自动换道与自动超车控制方法的研究[D];吉林大学;2005年
9 吴德文;遥感与地面观测数据的找矿信息提取和处理技术及应用[D];中国地质大学(北京);2006年
10 余庆军;智能图像处理及其在无线多媒体业务中的应用[D];华南理工大学;2004年
中国硕士学位论文全文数据库 前10条
1 程鹏飞;植物病害的图像处理及特征值提取方法的研究[D];山西农业大学;2005年
2 甘世民;基于图像的运动人体提取的研究与应用[D];大连海事大学;2005年
3 李小泉;自动检测系统关键技术研究[D];武汉理工大学;2006年
4 刘小光;沥青高速公路路面检测与破损率识别技术研究及系统实现[D];吉林大学;2006年
5 张建恩;基于计算机视觉的玻璃瓶缺陷检测系统[D];重庆大学;2005年
6 徐叶恒;基于数字图像处理的高温构件寿命评价研究[D];南京工业大学;2005年
7 牟洪波;基于人工神经网络的木材缺陷检测研究[D];东北林业大学;2006年
8 胡洪涛;食管细胞图像分析技术的实现方法研究[D];郑州大学;2007年
9 李大光;磨粒图像计算机识别分析方法研究与实现[D];武汉理工大学;2005年
10 王彬;通讯终端上名片识别系统的实现[D];武汉理工大学;2005年
中国重要报纸全文数据库 前10条
1 四川 刘焱彬;数码相机的图像处理[N];电子报;2001年
2 长人 编译;专家评索尼α100[N];中国摄影报;2006年
3 陈瑜唐婷;让计算机会看、会听、会说、会思考[N];科技日报;2007年
4 武文;索尼两系列电视新品亮相[N];中国质量报;2008年
5 孙婧;视频图像处理技术在案件中的应用[N];西部法制报;2008年
6 殷幼芳;印前图像处理技术对印刷质量的影响[N];中国包装报;2005年
7 ;智能化监控对图像处理能力提出更高要求[N];中国电子报;2009年
8 金彧;★图像处理实用小工具Qimage又推新版[N];中国电脑教育报;2002年
9 本报记者 刘晖;图像处理引擎的威力[N];计算机世界;2003年
10 赵军红 编译;仿生眼睛助盲人重见光明[N];科技日报;2010年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978