收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

中文版面分析的研究

张志彬  
【摘要】: 版面分析作为文字识别系统的预处理部分,其准确性直接影响文字的识别率。本文针对复杂的中文版面,提出了一个基于模糊连接度和识别特征的中文版面分析方法,完成了一个图像输入、倾斜校正、版面图文分割的过程。版面图文分割主要采用自底向上的办法,利用连通域搜索算法检测出文本页面上的所有连通基元,通过对连通基元的四个方向上的连接度进行模糊化处理来决定文字行、列的合并,并对在文字行合并时影响较大的标点符号采用先识别后合并的方法。为了减少时间开销,在计算和合并过程中采用局部搜索策略。实验结果表明,该方法对印刷质量比较好的中文版面具有较理想的分割效果。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 吕亚军;陈继荣;鹿晓亮;;基于内容的文档图像倾斜校正[J];计算机仿真;2006年12期
2 陈波;王加俊;吴陈;;基于页面前景和最小二乘法的倾斜校正[J];计算机工程;2007年15期
3 田学东,郭宝兰;基于组合特征的中文版面分析方法[J];中文信息学报;1999年04期
4 王德祥;浅谈清华文通OCR软件的使用(下)[J];通信世界;1999年02期
5 詹庄影;OCR文字识别系统使用技巧[J];华南金融电脑;2002年11期
6 刘建胜,汪同庆,王贵新,居琰;基于DSP的版面分析和OCR识别的原理及实现[J];仪器仪表学报;2003年06期
7 梁莹,施善旦;海蓝目录自动识别系统的设计[J];广西科学院学报;2004年04期
8 徐锐义;吴炜;何小海;杨玉科;;中文商务名片版面分割研究[J];四川大学学报(自然科学版);2008年02期
9 魏宏喜;高光来;;一种基于连通域的蒙古文文档图像版面分析方法[J];内蒙古大学学报(自然科学版);2007年05期
10 张伟业;赵群飞;;读书机器人的版面分析及文字图像预处理算法[J];微型电脑应用;2011年01期
11 钱卫华;图、文、表的快速输入——OCR文字识别技术(二)[J];铁道机车车辆工人;2000年02期
12 吴洋,田学东;中文版面分析中表格的识别[J];河北工业科技;2002年02期
13 楚杰;如何提高扫描仪的文字识别率[J];计算机与农业;2003年03期
14 姜哲,马少平,夏莹;大型中文古籍《四库全书》自动版面分析系统[J];中文信息学报;2000年02期
15 刘建胜,汪同庆,王贵新,居琰,袁祥辉;基于边框线的版面分析方法应用于选票处理[J];计算机工程与应用;2002年11期
16 李涛;;二分法在版面分析中的应用[J];信息技术与信息化;2006年04期
17 秦旭光;徐爱功;;图像几何校正在OCR文字识别中的应用[J];辽宁工程技术大学学报;2006年S2期
18 林晓帆,丁晓青,吴佑寿;名片自动录入系统的实现[J];数据采集与处理;1998年02期
19 张纯,张涛,黄笑;中文商务名片识别系统的实现[J];中文信息学报;2000年02期
20 王玉,张炘中,苏东庄;基于版面分析的文本管理系统[J];中文信息学报;1989年04期
中国重要会议论文全文数据库 前10条
1 李亚鹏;刘上乾;卢泉;;光电成像测量系统的物面倾斜校正[A];2011西部光子学学术会议论文摘要集[C];2011年
2 史广顺;潘武模;王庆人;;基于语法模式识别的信息提取技术及其在中文名片自动识别中的应用[A];2001年中国智能自动化会议论文集(上册)[C];2001年
3 梁莹;施善旦;;海蓝目录自动识别系统的设计[A];广西计算机学会2004年学术年会论文集[C];2004年
4 刘飞;罗予频;邱中奇;胡东成;;基于边框提取和递归划分的版面图象分析[A];1999年中国神经网络与信号处理学术会议论文集[C];1999年
5 吴雅楠;李建华;;一种基于DSP的文字识别方法的研究[A];第七届全国信息获取与处理学术会议论文集[C];2009年
6 杨立刚;张兴会;李兰友;;车牌照字符倾斜校正方法的研究[A];第二届全国信息获取与处理学术会议论文集[C];2004年
7 包艳花;图格木勒;;多字体印刷蒙古文识别后处理研究[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
8 王科俊;陈卉;;印刷体中文文档识别系统的研究[A];图像图形技术研究与应用2009——第四届图像图形技术与应用学术会议论文集[C];2009年
9 巨志勇;郑应平;;二值表格图像倾斜校正算法[A];第一届中国高校通信类院系学术研讨会论文集[C];2007年
10 毛经坤;罗予频;邱中奇;;复杂背景噪音下表格框线判定中的问题和解决方法[A];1999年中国神经网络与信号处理学术会议论文集[C];1999年
中国博士学位论文全文数据库 前10条
1 潘梅森;医学图像倾斜校正方法与应用研究[D];中南大学;2011年
2 杨波;基于内容的文档图象压缩方法研究[D];重庆大学;2002年
3 靳从;中文版面分析关键技术的研究[D];南京理工大学;2007年
4 程艳芬;离线阿拉伯手写体光学文字识别方法的研究[D];武汉理工大学;2009年
5 刘建胜;文档图象版面理解的研究[D];重庆大学;2002年
6 张艳;票据自动处理系统中若干关键技术研究[D];南京理工大学;2008年
7 陈光;特定领域OCR系统的精度与速度问题研究[D];北京邮电大学;2007年
8 张文波;Internet宏观拓扑结构的生命特征研究[D];东北大学;2006年
9 陈博;大规模网络资源消耗型攻击的检测和防范方法研究[D];哈尔滨工业大学;2007年
10 陈优广;边界跟踪、区域填充及链码的应用研究[D];华东师范大学;2006年
中国硕士学位论文全文数据库 前10条
1 张志彬;中文版面分析的研究[D];河北大学;2002年
2 李涛;基于邻域特征的版面分析[D];河北大学;2004年
3 范玉凤;基于复杂度的自适应中文版面分析方法研究[D];中国海洋大学;2010年
4 张铮;金融票据的版面分析及手写数字的识别[D];华中师范大学;2001年
5 张充;非文本块优先的中文版面分析[D];河北大学;2004年
6 郭芹;复杂结构的名片识别中版面分析方法研究[D];中国海洋大学;2008年
7 后俊;车牌图像分割与智能字符识别方法的研究[D];合肥工业大学;2004年
8 李云华;相似表格图像档案的表格提取与压缩存储方法研究[D];山东师范大学;2008年
9 王浩;测井图纸校正及数字化技术研究[D];哈尔滨工业大学;2007年
10 马婉婕;车牌识别系统中字符分割的研究与实现[D];复旦大学;2009年
中国重要报纸全文数据库 前10条
1 清萱;清华东方文字识别技术(OCR)达国际领先水平[N];人民日报海外版;2002年
2 仝仁;e-card文字识别率达98.6%[N];中国计算机报;2003年
3 机器猫;对《巧妙消除水印对文字识别的影响》一文的补充[N];电脑报;2004年
4 福建 柳坚;消除水印对文字识别的影响[N];电脑报;2004年
5 ;阿拉伯文文字识别系统[N];科技日报;2000年
6 本报记者 王燕;手写字板价格何时更亲民[N];中国消费者报;2010年
7 张文国;汉王文字识别技术研发跨入新世纪[N];中国劳动保障报;2000年
8 ;纸质文档一键电子化[N];中国计算机报;2006年
9 龙哥;攒出自己想要的电脑[N];中国计算机报;2004年
10 刘语;汉王资料笔全方位感受摘抄时尚[N];科技日报;2006年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978