收藏本站
《重庆大学》 2011年
收藏 | 手机打开
二维码
手机客户端打开本文

古籍手写汉字图像分割算法研究

朱雷  
【摘要】:文本图像的分割对于进行正确的单字提取和字符识别有着重大的影响和使用价值,而古籍手写汉字图像分割更是古籍汉字识别过程中的难点。同时古籍手写汉字图像的分割对开展古籍文物研究、文献研究及文字研究工作具有十分重要的价值。由于古籍汉字资料保存时间久远,大量存在纸张变色、破损、文字残缺等现象,导致古籍手写汉字图像噪声很大,处理难度很大。现有的大多数预处理及单字切分算法多以印刷文本图像为处理对象,在对古籍手写汉字图像进行处理时往往效果欠佳。因此,论文根据古籍手写汉字分割的要求对现有的方法进行改进,并设计了新的文本图像处理方法,以期得到满意的单字图像分割结果。 在参与对敦煌遗书等古籍进行研究的社科基金项目的过程中,分析了古籍手写汉字图像的特点和复杂性,在阈值分割、连通域标记和基于偏微分方程的目标轮廓提取等理论与算法的基础上,对古籍手写汉字图像的分割问题进行了深入的研究。主要内容有: ①针对单纯采用全局阈值法或局部阈值法对图像进行分割时的不足,提出了整体阈值与局部阈值相结合的二次OTSU算法。算法综合考虑全局阈值与局部阈值来确定各像素点的阈值。与单纯采用全局阈值法和单纯采用局部阈值法相比,该算法在克服了以上两种算法的缺点的同时,继承了以上两种算法的优点,既考虑到了局部图像的特殊性,也兼顾了整个图像的整体性。通过实验证明,这种方法很好地将全局阈值的概括性与局部阈值的针对性结合了起来,能够取得明显优于原来两种算法的处理结果,这给后续的字符切分打下了良好的基础。 ②针对传统连通域标记算法需要多次扫描才能完成像素标记,运算时间较长的缺点,提出了快速非递归连通域生成及合并算法。算法对二值图像只需进行一次扫描,对需要识别的目标进行标记,遇到分叉时即进行连通域的合并。因此,在扫描过程中就可得到已扫描区域中的连通域,一次扫描后,无需再进行任何处理,就得到了二值图像的连通域的正确划分。实验证明,算法对于简单图像、一次分叉图像、多次分叉图像、连通域相互包含的图像,都可以正确、快速地进行连通域的标记处理。 ③应用快速非递归连通域生成及合并算法,设计了基于连通域特征的去噪去边框算法,及基于连通域并结合方块字特征进行单字切分的算法。并进一步采用局部投影法进行粘连字的切分。对应用快速连通域标记算法进行手写汉字图像处理的算法都进行了实验及结果分析。实践证明算法对手写汉字图像进行连通域生成、去噪、去边框及单字切分效果良好。 ④针对传统C-V主动轮廓模型达到稳定状态所需的迭代次数过多,对图像的尺寸比较敏感的缺点,提出了局部C-V主动轮廓模型快速图像分割算法。算法对图像进行预先的分块,将各分块单独作为输入图像以C-V模型算法进行分割处理。实验证明,算法在保证处理效果的前提下速度上得到了极大的提高。 ⑤根据手写汉字每个汉字单独成块的特点,提出了窄带快速C-V手写汉字图像分割方法。算法首先采用阈值法对汉字进行初步的分割,再利用汉字图像的连通域信息,进行汉字图像轮廓标记及窄带的构造,进一步进行基于窄带C-V模型的手写汉字图像分割。实验表明,采用窄带法对手写汉字进行分割,能够保留更多的文字细节,更加真实自然,同时处理速度进一步提高,有利于对文字进行后续的分析研究。 综合本文提出的各种手写汉字图像分割算法,设计出了对手写汉字图像进行分割处理的完整的算法流程。对灰度化的手写汉字图像采用二次OTSU算法,对整幅图像进行二值化处理。接着采用非递归快速连通域算法,标记出图像的连通域情况。根据手写汉字的特点,进行去边框、去噪及单个汉字的分割操作。根据连通域情况初步分割出单个汉字后,再从原灰度图像中的对应位置取出小图像,采用OTSU算法进行二值化,以避免由于一个汉字处理不同区域采用不同阈值造成的差异。对以此方法得到的二值化图像进行轮廓标记。对每个单个汉字的原图像区域,以刚得到的轮廓为窄带划分的依据,采用前述的窄带C-V算法,进行汉字图像的细致分割。 采用本文所提出的一系列算法对古籍手写汉字图像进行分割,能在提高处理效率的同时得到良好的分割效果。
【学位授予单位】:重庆大学
【学位级别】:博士
【学位授予年份】:2011
【分类号】:TP391.41

手机知网App
【参考文献】
中国期刊全文数据库 前10条
1 丁晓青,郭繁夏;中文OCR技术最新进展[J];电子出版;1995年12期
2 丁晓青;汉字识别研究的回顾[J];电子学报;2002年09期
3 梁光明;唐朝京;刘东华;孙即祥;张志涛;;基于分割评价的多层次自适应双阈值分割算法[J];电子学报;2009年04期
4 赵继印;郑蕊蕊;吴宝春;李敏;;脱机手写体汉字识别综述[J];电子学报;2010年02期
5 丁龙,陆俞,颜世崇;汉字OCR的原理、方法与应用[J];高师理科学刊;1998年02期
6 王雷光;刘国英;梅天灿;秦前清;;一种光谱与纹理特征加权的高分辨率遥感纹理分割算法[J];光学学报;2009年11期
7 王宇,王乘,刘吉平;一种基于数学形态学的遥感图象边缘检测算法[J];计算机工程与应用;2003年30期
8 刘习文;蒋艳荣;罗显光;;一种改进的图像模糊增强算法[J];计算机工程与应用;2008年04期
9 杜亚勤;郭雷;陈亮;;一种遗传优化和Ostu的图像模糊边缘特征提取方法[J];计算机工程与应用;2009年19期
10 陈亮;郭雷;王雅萍;杜亚勤;;一种基于结构张量的MAS边缘检测算法[J];计算机科学;2009年01期
【共引文献】
中国期刊全文数据库 前10条
1 程一斌,汪松,任彬;利用弹簧模型提取物体轮廓[J];安徽大学学报(自然科学版);2001年02期
2 张坤,罗立民,舒华忠,杨芳;基于Level Set方法的Visible Human Being虚拟人图像处理[J];安徽大学学报(自然科学版);2005年04期
3 陈兴杰;柴晓冬;;一种基于简化PCNN的红外图像分割方法[J];安徽大学学报(自然科学版);2010年01期
4 张崚,路威;基于小波尺度共生矩阵的分割算法在地物提取中的应用[J];安徽工程科技学院学报;2002年02期
5 张雪飞;;基于GVF模型的蔬果图像快速分割方法[J];安徽农业科学;2010年05期
6 石雪强;程新文;李春福;宁亚飞;杨程永;杨翠莲;;自然环境下苹果彩色图像分割研究[J];安徽农业科学;2011年30期
7 卢作伟;崔桂香;张兆顺;;NUMERICAL SIMULATION OF THE FLOW WITH CONTACT LINES[J];Acta Mechanica Sinica;1997年03期
8 罗志灶;周赢武;郑忠楷;;二值图像连通域标记优化算法[J];安庆师范学院学报(自然科学版);2010年04期
9 赵莹;张学东;;改进水平集的车辆检测算法[J];辽宁科技大学学报;2010年05期
10 张鹤;董彦麟;;一种改进的变分水平集车辆检测技术[J];辽宁科技大学学报;2011年03期
中国重要会议论文全文数据库 前10条
1 谭守标;霍剑青;郝建;王晓蒲;赵永飞;谢行恕;;高分辨率软X射线显微成像下细胞的自动提取?[A];2005年“数字安徽”博士科技论坛论文集[C];2005年
2 ;A Hardware-Accelerated Segmentation Algorithm for Moving Object Generation[A];第二十七届中国控制会议论文集[C];2008年
3 周佳男;;一种拓扑纹理图像的相位场模型分割算法[A];第二十七届中国控制会议论文集[C];2008年
4 ;Edge Detection of Wood Defects in X-ray Wood Image Using Neural Network and Mathematical Morphology[A];第二十九届中国控制会议论文集[C];2010年
5 邱雪娜;刘士荣;刘斐;朱伟涛;杜方芳;;一种基于序贯检测机制的运动目标跟踪算法[A];第二十九届中国控制会议论文集[C];2010年
6 赵建;刘伟宁;;基于主动轮廓模型的海天线检测算法[A];第九届全国信息获取与处理学术会议论文集Ⅰ[C];2011年
7 田野;孙凤杰;;基于遗传微粒群算法的输电线路图像分割方法研究[A];图像图形技术研究与应用(2010)[C];2010年
8 陈晓钟;孙华燕;;基于更佳分辨率小波分解的图像纹理分类[A];第九届全国信号处理学术年会(CCSP-99)论文集[C];1999年
9 刘勋;孟骧龙;毋立芳;;基于自适应对象模型的篮球运动跟踪方法[A];第十二届全国信号处理学术年会(CCSP-2005)论文集[C];2005年
10 吕玉增;彭启民;黎湘;;基于Radon变换的不变性形状识别[A];第十三届全国信号处理学术年会(CCSP-2007)论文集[C];2007年
中国博士学位论文全文数据库 前10条
1 贾瑞生;矿山开采沉陷三维建模与可视化方法研究[D];山东科技大学;2010年
2 王兴梅;水下声纳图像的MRF目标检测与水平集的轮廓提取方法研究[D];哈尔滨工程大学;2010年
3 梁洪;基于内容的医学图像检索及语义建模关键技术研究[D];哈尔滨工程大学;2010年
4 林颖;基于水平集方法的图像分割关键技术研究[D];哈尔滨工程大学;2010年
5 时长江;豆科类杂草种子图像识别系统研究[D];中国海洋大学;2009年
6 韩守东;纹理建模与图切分优化方法研究[D];华中科技大学;2010年
7 莫堃;基于隐式函数的曲面重构方法及其应用[D];华中科技大学;2010年
8 涂虬;智能视觉监视中目标检测与跟踪算法研究[D];华中科技大学;2010年
9 徐萧萧;基于特征学习与特征联想的视觉跟踪算法研究[D];中国科学技术大学;2010年
10 王义文;钢球表面缺陷检测关键技术研究及样机研制[D];哈尔滨理工大学;2010年
中国硕士学位论文全文数据库 前10条
1 孙涛;基于DR骨密度分析系统的研究[D];南京医科大学;2010年
2 余亮;基于DSP的注射器针头合格检测方法研究[D];南昌航空大学;2010年
3 廖甜甜;白细胞图像语义识别分类的研究[D];南昌航空大学;2010年
4 田冰;基于SOM网的多目标图像轮廓提取技术的研究[D];南昌航空大学;2010年
5 赵永刚;图像检索中形状描述和匹配算法研究[D];南昌航空大学;2010年
6 孙静;基于双目立体视觉的多相机三维重建技术实现[D];山东科技大学;2010年
7 解斐斐;UAV城市高质量DOM制作方法研究[D];山东科技大学;2010年
8 胡申宁;中医舌诊中舌色、苔色自动分类的研究[D];浙江理工大学;2010年
9 李光;基于均值偏移的视频目标跟踪、检测算法研究及系统实现[D];浙江理工大学;2010年
10 陈欣欣;基于CT图像的血管分割[D];郑州大学;2010年
【二级参考文献】
中国期刊全文数据库 前10条
1 高彦宇,杨扬,陈飞;基于融合特征和LS-SVM的脱机手写体汉字识别[J];北京科技大学学报;2005年04期
2 李美丽;杨杨;李岩;;基于形态学变换的有限集手写体汉字识别[J];传感技术学报;2007年05期
3 居琰,汪同庆,彭建,刘建胜,袁祥辉;特征融合用于手写体汉字识别研究[J];电子科技大学学报;2002年03期
4 金连文,徐秉铮;手写体汉字识别中的一种新的特征提取方法——弹性网格方向分解特征[J];电路与系统学报;1997年03期
5 姜璐,章品正,舒华忠;矩在面部表情识别中的应用[J];东南大学学报(自然科学版);2004年04期
6 龚坚,李立源,陈维南;二维熵阈值分割的快速算法[J];东南大学学报;1996年04期
7 刘冰;;多类SVM分类算法的研究和改进[J];电脑知识与技术(学术交流);2007年06期
8 徐旭;姜飞;;简述粒子群算法的原理及改进[J];电脑知识与技术;2008年12期
9 栾元重;范玉红;王永;葛仁华;张东;;塌陷区地形分形生成方法与应用[J];地球信息科学;2006年04期
10 丁晓青,吴佑寿;模式识别统一熵理论[J];电子学报;1993年08期
【相似文献】
中国期刊全文数据库 前10条
1 陈治平,林亚平,李军义;基于笔划和笔顺的汉字识别算法[J];湖南大学学报(自然科学版);2000年04期
2 林东胜;OCR汉字识别技术进展[J];职业教育研究;2004年S1期
3 郑军;林民;;一种面向集外字输入的手写汉字轮廓提取算法[J];内蒙古师范大学学报(自然科学汉文版);2008年06期
4 舒文豪;唐降龙;李澜;;微机手写汉字联机识别系统的原理与实现[J];计算机研究与发展;1987年12期
5 高学,徐睿,金连文,尹俊勋,镇立新;一种基于运动图像的在线手写汉字识别方法[J];电子学报;2004年08期
6 陈思;手写汉字输入技术的发展与应用[J];计算机周刊;1996年21期
7 Before;成为“书法家”只需一分钟——Ougishi使用一点通[J];电脑应用文萃;2005年02期
8 帅典勋;基于Radon变换的手写汉字的识别方法[J];计算机学报;1984年04期
9 小聪;国产“738神笔”手写汉字输入系统贴近人们记录习惯 简单易学[J];中文信息;1996年03期
10 涂深俊;关于手写汉字的切分算法的探讨[J];黄石高等专科学校学报;1998年02期
中国重要会议论文全文数据库 前10条
1 陈亮;叶旭鸣;俞利;;一种基于图论的图像分割算法[A];全国第4届信号和智能信息处理与应用学术会议论文集[C];2010年
2 黄磊;刘昌平;刘迎建;;基于非参数化降维的手写汉字识别研究[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
3 明生;邬长安;马珂;;一种基于Canny检测算子的图像分割算法[A];计算机研究新进展(2010)——河南省计算机学会2010年学术年会论文集[C];2010年
4 李鹏飞;龙观水;景军锋;;一种改进的彩色纹理图像分割算法[A];第十五届全国图象图形学学术会议论文集[C];2010年
5 崔怀林;;一种手写汉字识别的笔划直接抽取算法[A];1999年中国智能自动化学术会议论文集(上册)[C];1999年
6 王士龙;万磊;唐旭东;;一种基于直方图改进的FCM聚类水下图像分割算法[A];第二十九届中国控制会议论文集[C];2010年
7 赵海英;杨一帆;徐光美;;基于边缘形态变换的彩色织物图像分割算法[A];第十五届全国图象图形学学术会议论文集[C];2010年
8 牛光;曹守见;姬武军;;汉字手写样本集数据聚类算法的分析与实现[A];计算机技术与应用进展·2007——全国第18届计算机技术与应用(CACIS)学术会议论文集[C];2007年
9 赵广建;贠超;;基于SVM/HMM混合模型的银行票据识别系统研究[A];先进制造技术论坛暨第三届制造业自动化与信息化技术交流会论文集[C];2004年
10 赵广建;贠超;;基于SVM/HMM混合模型的银行票据识别系统研究[A];《制造业自动化与网络化制造》学术交流会论文集[C];2004年
中国重要报纸全文数据库 前10条
1 本报记者 于广翔;网络时代手写汉字亟需拯救[N];齐齐哈尔日报;2011年
2 大同军分区政委 董其高;书写显现鲜明个性[N];光明日报;2010年
3 顾艳伟;专家建议:书法应成为学生必修课[N];中国消费者报;2008年
4 王小龙;美开发出基于热映像的图像分割算法[N];科技日报;2011年
5 李晓霞;方块字离我们有多远[N];兰州日报;2005年
6 陈永舜;音码和形码和谐共处为汉语服务[N];光明日报;2006年
7 记者 张琪;e时代青年人疏远了方块字[N];兰州日报;2005年
8 汉王科技公司董事长 刘迎建;手写汉字更具独特魅力[N];光明日报;2008年
9 谢培红;Inspur———浪潮启用新的品牌标识[N];科技日报;2006年
10 川报集团特派记者 胡彦殊;横竖撇点捺:考级可以有 考试不必要[N];四川日报;2010年
中国博士学位论文全文数据库 前10条
1 朱雷;古籍手写汉字图像分割算法研究[D];重庆大学;2011年
2 许晓丽;基于聚类分析的图像分割算法研究[D];哈尔滨工程大学;2012年
3 苏哲文;手写汉字图像动态信息恢复方法研究[D];华中科技大学;2009年
4 皮志明;结合深度信息的图像分割算法研究[D];中国科学技术大学;2013年
5 车娜;基于偏移场的核磁共振脑图像分割算法研究[D];吉林大学;2013年
6 郭丽;交互式图像分割算法的研究与应用[D];东北大学;2009年
7 李刚;基于图像工程的路面破损自动识别算法研究[D];长安大学;2010年
8 龙腾;旋转方向无关的无约束手写中文词组识别[D];华南理工大学;2008年
9 林磊;基于MRI的大脑皮层形态学研究[D];浙江大学;2010年
10 杨端端;手写虚拟汉字识别研究及其在多通道短信交互系统中的应用[D];华南理工大学;2007年
中国硕士学位论文全文数据库 前10条
1 黄盛明;联机手写汉字的旋转无关识别研究[D];华南理工大学;2010年
2 吴喜娜;汉字手写轨迹及特征的自检效应研究[D];华东师范大学;2004年
3 邓国强;无约束联机手写汉字特征提取与识别融合的研究[D];华南理工大学;2010年
4 张欣;基于四角结构特征的脱机手写汉字识别[D];河北大学;2010年
5 温智宁;应用于书法风格模拟的手写汉字美化方法研究[D];华南理工大学;2012年
6 刘丽娟;个性化联机手写汉字隶书美化方法研究[D];华南理工大学;2011年
7 严汉羽;联机无约束手写汉字文本行识别[D];华南理工大学;2011年
8 李红睿;基于动态粗外围方向线素特征的脱机手写汉字识别[D];河北大学;2009年
9 李小园;基于结构分析的离线手写汉字切分[D];河北大学;2009年
10 贾新彪;基于笔画结构特征的脱机手写汉字识别[D];河北大学;2010年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026