收藏本站
《华南理工大学》 2017年
收藏 | 手机打开
二维码
手机客户端打开本文

基于智能手机的中文文档数字化研究与实现

张浩  
【摘要】:智能手机已经实现普及,随着智能手机拥有越来越强大的拍摄和处理能力,基于智能手机实现一套文档数字化系统,能够在一定程度上替代扫描仪,可以给人们的工作和生活带来更多的便利。本文主要工作包括:深入分析研究谷歌开源项目Tesseract-OCR,并针对简体中文识别进行了优化,在提高简体中文识别速度超过4倍的同时还在一定程度上提高了识别率,对简体中文的优化成果也同样适用于繁体中文、日文、韩文等;由于手机拍摄图像质量不稳定,本文讨论了图像采集阶段的用户引导措施和采集后进行倾斜弯曲校正、去噪和二值化等图像处理过程以提供高质量的图像输入,并提出了一种用于复杂背景和光照条件下进行图像二值化的自适应双阈值法实现方案;在上述工作的基础上,设计和实现了一个基于安卓手机平台的文档数字化系统原型,利用增强的图像处理模块和优化后的谷歌开源OCR项目Tesseract进行文字和版面识别,最后将识别结果与处理后的图片结合生成可搜索的双层PDF格式文件。
【学位授予单位】:华南理工大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TP391.41

手机知网App
【参考文献】
中国期刊全文数据库 前7条
1 曾凡锋;王晓;吴飞飞;;基于文本行重构的扭曲文档快速校正方法[J];计算机工程与设计;2014年02期
2 崔伟男;闵栋;;移动智能终端操作系统发展趋势分析[J];电信网技术;2013年05期
3 王文华;;浅谈OCR技术的发展和应用[J];福建电脑;2012年06期
4 罗志灶;周赢武;郑忠楷;;二值图像连通域标记优化算法[J];安庆师范学院学报(自然科学版);2010年04期
5 许新征;丁世飞;史忠植;贾伟宽;;图像分割的新理论和新方法[J];电子学报;2010年S1期
6 林开颜,吴军辉,徐立鸿;彩色图像分割方法综述[J];中国图象图形学报;2005年01期
7 洪子泉,杨静宇;统计模式识别中的特征抽取[J];数据采集与处理;1991年02期
中国博士学位论文全文数据库 前2条
1 李艳梅;图像增强的相关技术及应用研究[D];电子科技大学;2013年
2 孙羽菲;低质量文本图像OCR技术的研究[D];中国科学院研究生院(计算技术研究所);2005年
中国硕士学位论文全文数据库 前6条
1 李小锋;基于非文本图像优先的中文版面分析技术研究和应用[D];北方工业大学;2010年
2 党兴;复杂的中文文档图像版面分析研究[D];苏州大学;2010年
3 桑应宾;基于K近邻的分类算法研究[D];重庆大学;2009年
4 袁俊;数字形态学理论及其在图像处理中的应用[D];武汉理工大学;2007年
5 王丽亚;图像的特征提取和分类[D];西安电子科技大学;2006年
6 李涛;基于邻域特征的版面分析[D];河北大学;2004年
【共引文献】
中国期刊全文数据库 前10条
1 王诗钧;印佳奇;徐靖峰;李振;梁久祯;;一种车牌快速矫正算法[J];常州大学学报(自然科学版);2018年04期
2 胡晓丽;钟昊;李彤;;基于二值图像连通域的甘蔗螟虫识别计数方法[J];桂林电子科技大学学报;2018年03期
3 董建民;李丽宁;;基于色彩向量的藏式传统建筑外观数字特征提取[J];软件导刊;2018年07期
4 罗敏;刘洞波;王宁;陈鑫海;;改进核模糊C均值聚类算法在服装图像分割中的研究[J];湖南工程学院学报(自然科学版);2018年02期
5 史露娜;兰蓉;;基于模糊隶属度中值的阈值分割算法[J];现代电子技术;2018年11期
6 曾凡锋;许博臣;;基于SVM的复杂版面分割方法[J];电子技术与软件工程;2018年10期
7 丁明月;庄晓东;;基于数据融合的K均值聚类彩色图像分割方法[J];青岛大学学报(工程技术版);2018年02期
8 鄂雪;程朋乐;;基于改进归一化割的立木边缘识别技术研究[J];西北林学院学报;2018年03期
9 王杰;刘向晴;;彩色图像分割的FCM预分类核极限学习机方法[J];郑州大学学报(理学版);2018年02期
10 杨红亚;赵景秀;徐冠华;刘爽;;彩色图像分割方法综述[J];软件导刊;2018年04期
中国博士学位论文全文数据库 前7条
1 李赓飞;自适应图像实时增强算法的技术研究[D];中国科学院大学(中国科学院长春光学精密机械与物理研究所);2017年
2 赵青青;生物光信息处理技术研究[D];中国科学院大学(中国科学院上海技术物理研究所);2017年
3 武昆;基于边缘保持滤波器的彩色图像增强算法研究[D];中国科学院长春光学精密机械与物理研究所;2017年
4 陈燕;工业X射线图像增强算法研究[D];中北大学;2016年
5 许宁;中国大陆海岸线及海岸工程时空变化研究[D];中国科学院烟台海岸带研究所;2016年
6 李毅;基于视觉模型的红外图像增强技术研究[D];中国科学院研究生院(长春光学精密机械与物理研究所);2016年
7 郭承青;抗打印扫描数字水印技术及其应用研究[D];北京邮电大学;2011年
中国硕士学位论文全文数据库 前10条
1 金宏硕;基于Kinect的手势图像识别研究[D];沈阳工业大学;2018年
2 张蕾;基于稀疏表示的图像超分辨率重建算法研究[D];中国地质大学(北京);2018年
3 白维珊;基于用户行为分析的作弊预警模型研究与实现[D];电子科技大学;2018年
4 张铎;基于改进聚类算法的光伏组件图像识别技术[D];浙江大学;2018年
5 张浩;基于智能手机的中文文档数字化研究与实现[D];华南理工大学;2017年
6 王艳文;蒙古文文档图像版面分析及识别后处理的研究与实现[D];内蒙古大学;2017年
7 贾致真;基于拉曼光谱的乳腺良恶性肿瘤识别模型研究[D];东北师范大学;2017年
8 张兵;自适应KNN分类算法及其在个人信用风险评估中的应用[D];广西大学;2017年
9 杨博;基于智能移动终端的人体运动识别技术研究与应用[D];西南交通大学;2017年
10 陈旺;老年人助行机器人创新设计研究[D];湖北工业大学;2017年
【二级参考文献】
中国期刊全文数据库 前10条
1 许洪波;;抓住产业技术变革契机 发展我国新一代网络操作系统[J];信息技术与标准化;2012年11期
2 李俭伟;;HTML5打破智能手机操作系统“围墙” 标准进展缓慢成不确定因素[J];通信世界;2011年44期
3 张伟业;赵群飞;;读书机器人的版面分析及文字图像预处理算法[J];微型电脑应用;2011年01期
4 宋丽丽;吴亚东;孙波;;文档图像几何畸变快速校正的新方法[J];计算机应用;2010年12期
5 侯玉华;韩玲;;3G终端软件平台发展现状和趋势[J];移动通信;2010年17期
6 宋斌;;一种新的图像连通域快速标号算法[J];电子测量技术;2009年09期
7 王彦春;梁德群;王演;;基于图像模糊熵邻域非一致性的过渡区提取与分割[J];电子学报;2008年12期
8 龙辉平;习胜丰;侯新华;;实验数据的最小二乘拟合算法与分析[J];计算技术与自动化;2008年03期
9 刘丙涛;田铮;李小斌;周强锋;;基于图论Gomory-Hu算法的SAR图像多尺度分割[J];宇航学报;2008年03期
10 ;Artificial immune kernel clustering network for unsupervised image segmentation[J];Progress in Natural Science;2008年04期
中国硕士学位论文全文数据库 前3条
1 李钊;中英文混排文字识别系统的设计与实现[D];电子科技大学;2007年
2 张淑兵;文本图像的几何畸变校正技术研究[D];西安电子科技大学;2007年
3 李艳玲;文本图像页面分割和分类技术的研究[D];苏州大学;2004年
【相似文献】
中国期刊全文数据库 前10条
1 ;传统向智能的飞跃——智能监护“云”时代[J];中国医学装备;2017年12期
2 颜嘉良;;智能技术在生活中发展趋势[J];电子技术与软件工程;2017年22期
3 任为;;手机智能时代,你的手机“OCR”了吗?[J];数码世界;2007年02期
4 张泉灵;洪艳萍;;智能工厂综述[J];自动化仪表;2018年08期
5 陈丞;;疯狂编辑部之智能手环[J];作文大王(中高年级);2018年Z2期
6 黄久松;;《智能建筑》杂志创刊20周年特殊贡献企业[J];智能建筑;2017年05期
7 ;2016年度全国智能建筑行业十大品牌企业[J];智能建筑;2017年04期
8 ;2016年度全国智能建筑行业十佳企业[J];智能建筑;2017年04期
9 ;2016年度全国智能建筑行业十大创新产品品牌企业[J];智能建筑;2017年04期
10 韩向东;;韩向东:智能财务 “未来”已来[J];新理财;2017年12期
中国重要会议论文全文数据库 前10条
1 梁卓宇;;智能交通发展探索[A];养护与管理2018年第3期(总第85期)[C];2018年
2 赵枫;蒲力戈;张艳;刘红文;;智能快递柜在计量送检中的应用[A];2017年第七届全国地方机械工程学会学术年会暨海峡两岸机械科技学术论坛论文集[C];2017年
3 高峰;;智能电视规范概述[A];第22届中国数字广播电视与网络发展年会暨第13届全国互联网与音视频广播发展研讨会论文集[C];2014年
4 刘敏;;智能建筑的系统构成及造价确定[A];天津建材(2007年第4期 总第136期)[C];2007年
5 毛鸿禧;徐征远;;热电联产技术突破――“阳光智能瓦”热电联产[A];第二届热电联产节能降耗新技术研讨会论文集[C];2013年
6 毛鸿禧;徐征远;;热电联产技术突破——“阳光智能瓦”热电联产[A];2014集中供热优化运行系统节能技术交流研讨会论文集[C];2014年
7 王蛟;;电气智能建筑探析[A];工程技术发展论文集[C];2015年
8 徐昊娟;严华;;智能穿戴类产品用户体验研究方法及机会分析探寻[A];工业设计研究(第三辑)[C];2015年
9 王继曼;;电子智能服饰的研究进展[A];铜牛杯第九届功能性纺织品及纳米技术研讨会论文集[C];2009年
10 裘进浩;;智能可变形飞行器研究中存在的若干问题的思考[A];智能可变形飞行器发展前景及我们的选择——新观点新学说学术沙龙文集(32)[C];2009年
中国重要报纸全文数据库 前10条
1 本报记者 苏旭辉;智能切入共享经济[N];中国贸易报;2018年
2 贾丽华 实习生 刘畅 王馨苹;智能手机时代 梦想照进现实[N];中国青年报;2010年
3 魏运华 魏淑超 王铎;创新设计打造钢铁精品基地绿色智能引领冶金行业发展[N];世界金属导报;2018年
4 记者 甘皙;全国智能快件箱保有量达到24万组[N];工人日报;2018年
5 雯雯;晴雨智能获1.5亿元A轮融资[N];中国消费者报;2018年
6 本报记者 桑雪骐;新兴智能设备让家更好玩[N];中国消费者报;2018年
7 谭志红 陈颖 郑铿志;佛山智能文化家建设迈向标准化、品牌化[N];中国文化报;2018年
8 本报记者 杨洁 实习记者 张兴旺;全球智能手机出货量连续下滑[N];中国证券报;2018年
9 记者 米哲;提高数据素养 增强智能监管能力[N];天津日报;2018年
10 范俊 官斯焰 本报特约通讯员 唐继光;智能手机,管好也要用好[N];解放军报;2018年
中国博士学位论文全文数据库 前10条
1 Siror, Jospeh Kiplagat;RFID在智能海关中的潜在应用与挑战[D];上海交通大学;2011年
2 IROR, JOSEPHKIPLAGAT;RFID在智能海关中的潜在应用与挑战[D];上海交通大学;2011年
3 蒲海涛;物联网环境下基于上下文感知的智能交互关键技术研究[D];山东科技大学;2011年
4 李育哲;企业创新活动、智能资本及经营发展的关联与绩效评价研究[D];暨南大学;2008年
5 金星;基于全信息理论的智能授导系统创作应用综合平台研究[D];北京邮电大学;2008年
6 周晓军;生产系统智能维护决策及优化技术研究[D];上海交通大学;2006年
7 尚宗敏;智能流程异常处理的若干关键技术研究[D];山东大学;2009年
8 王创;基于强化理论的视角理解和预测智能手机社交应用的上瘾行为[D];中国科学技术大学;2015年
9 高峰;智能天线阵列的研究与实现[D];西安电子科技大学;2007年
10 任飞;智能电视软件平台关键技术研究[D];电子科技大学;2013年
中国硕士学位论文全文数据库 前10条
1 张浩;基于智能手机的中文文档数字化研究与实现[D];华南理工大学;2017年
2 甘雪丽;智能可穿戴设备在武汉市路跑人群的应用研究[D];湖北大学;2017年
3 申红艳;基于情感化设计理论的智能防盗门交互设计研究[D];山东大学;2017年
4 严晶;智能手机时代大学生网络自律意识培育研究[D];湖北工业大学;2016年
5 毛航天;人工智能中智能概念的发展研究[D];华东师范大学;2016年
6 肖蕊;智能室内无线节电系统的研究与设计[D];天津科技大学;2016年
7 侯丽君;智能手机对高中生人际交往的影响研究[D];山西农业大学;2016年
8 冯斌;智能快件箱布局规划与运营模式研究[D];北京交通大学;2015年
9 全天明;智能手机犯罪现状及对策研究[D];延边大学;2015年
10 李妍伶;基于3G智能手机的成人非正式学习研究[D];四川师范大学;2014年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026