收藏本站
《沈阳工业大学》 2012年
收藏 | 手机打开
二维码
手机客户端打开本文

印刷体数学公式识别的研究与实现

喻志强  
【摘要】:目前,OCR技术逐步发展成熟,可以快速、准确地使大部分书籍资料电子化。虽然OCR技术对文字和数字的识别效果很好,但对数学公式的识别效果并不理想,原因在于数学公式有复杂的二维结构,字符之间的逻辑关系种类多样。正确的识别数学公式不仅对单个数学符号进行正确的分割和识别,同时还要求对公式结构进行准确的分析。 本文设计了一个数学公式识别系统,实现了对印刷体数学公式的识别功能。系统以图片形式输入,经过图像预处理、字符分割、字符识别和结构分析等处理操作后,将其转化为以Txt格式的文本形式输出。字符分割部分使用了循环的投影分割法与连通域分割法相结合的方法,先利用垂直与水平投影法循环投影将公式切分为子字符块,再利用连通域法把投影法无法分割开的字符块分割开,这种混合分割的方法比起使用单一的方法效果要好。对字符粘连部分提出了基于矩形框的分割方法,利用字符库中字符的宽和高对粘连字符进行切分,切分后有验证步骤,进而降低了分割错误的概率。在结构分析部分提出了字符块编码与构建分叉树相结合的分析方法,该方法在公式分割时就将字符块按垂直和水平分割法分开时进行了有序的编码,为结构分析奠定了基础。在结构分析阶段利用编码与分叉树对公式的各个字符块进行分析重构。 本文在对数学表达式识别各阶段所使用的各种方法进行总结分析的同时,对使用到的方法编程实现,并给出了实验结果。通过实验验证,本文提出的方法可以有效的分割和识别出单个字符和粘连字符,经过识别和结构分析,最终以文本形式输出。
【学位授予单位】:沈阳工业大学
【学位级别】:硕士
【学位授予年份】:2012
【分类号】:TP391.41

【相似文献】
中国期刊全文数据库 前10条
1 郝保水;;Equation Chapter 1 Section 1联机手写数学公式识别技术[J];大众科技;2011年06期
2 纪宏伟;;基于MathML的WEB数学公式实现[J];科技经济市场;2011年07期
3 陈小强;张毅;;基于Web的辅助教学系统数学内容的处理[J];重庆科技学院学报(自然科学版);2011年03期
4 宋立军;;浅论网络数学搜索中的数学查询语言与索引的研究[J];科技创新导报;2011年21期
5 陈定保;;关于数学符号和公式排版格式的建议[J];中国科技期刊研究;2001年02期
6 ;第四届中国数字出版博览会主论坛嘉宾观点摘要[J];出版参考;2011年21期
7 韩涛;;多形态数字产品繁荣出版市场[J];出版参考;2011年19期
8 诸葛建伟;程波波;;理解加密技术[J];中国教育网络;2011年08期
9 梅宇航;顾岩;;基于Mathematica的运动学问题的可视化求解[J];中学物理;2011年15期
10 沈锡宾;顾恬;吕小东;刘冰;;国外一基于XML的科技期刊出版工作流个案剖析[J];中国科技期刊研究;2011年04期
中国重要会议论文全文数据库 前10条
1 李娟;;利用维思组版系统巧排数学公式[A];庆祝中华人民共和国成立50周年编辑学论文集[C];1999年
2 蔡川;苏伟;李冠宇;赵燕娟;李廉;;MathML编辑及显示技术研究[A];2006年全国理论计算机科学学术年会论文集[C];2006年
3 尤勇;;创作角色的过程[A];电影表演创新集——第九届“电影表演艺术学会奖”文集[C];2003年
4 方芳;;浅谈数学教学生活化问题[A];江苏省教育学会2006年年会论文集(综合二专辑)[C];2006年
5 钟晓刚;李新友;唐泽圣;;机械图中标注字符粘连问题的解决[A];中国图象图形科学技术新进展——第九届全国图象图形科技大会论文集[C];1998年
6 王正富;陈公亮;;科技期刊中数学公式的编排雏议[A];科技期刊编辑研究文集[C];1993年
7 郑天翔;谢亮;杨力华;;表格手写数字串的若干技术研究[A];第十三届全国图象图形学学术会议论文集[C];2006年
8 卢达;浦炜;谢铭培;;一种实时手写数学公式识别系统[A];2005全国自动化新技术学术交流会论文集(三)[C];2005年
9 袁素俊;;培养学生应用数学意识之我见[A];中国当代教育理论文献——第四届中国教育家大会成果汇编(上)[C];2007年
10 肖敏;黄磊;刘迎建;;数学公式识别系统[A];第八届全国汉字识别学术会议论文集[C];2002年
中国重要报纸全文数据库 前10条
1 张清;数学公式输入不求人[N];中国电脑教育报;2002年
2 四川省资中县球溪高级中学 蒋礼卫;类比教学在数学公式中的应用[N];学知报;2011年
3 江山;汉王发布手写公式[N];中华工商时报;2006年
4 杨振中;汉王发布手写公式[N];电子资讯时报;2006年
5 魏文忠,刘必祥,陈光平;探寻精细化管理的"数学公式"[N];中国税务报;2005年
6 山东 吕立霞;一步一步学数学公式的输入[N];电脑报;2005年
7 朱建中;在《几何画板》中使用数学公式或符号[N];中国电脑教育报;2003年
8 刘同军;在《几何画板》中编辑数学公式[N];中国电脑教育报;2003年
9 杨建邺;数学公式还会吓跑人吗?[N];中国图书商报;2006年
10 张亚君;如何实现公式颜色的更改[N];中国电脑教育报;2007年
中国博士学位论文全文数据库 前10条
1 苏伟;基于Web的数学公式输入及可访问性关键问题研究[D];兰州大学;2010年
2 马瑞;非限制手写字符分割中相关技术与算法的研究[D];南京理工大学;2007年
3 杨巨峰;联机手写化学公式处理关键问题研究[D];南开大学;2009年
4 张志伟;数学表达式数字化处理中关键技术的研究[D];中国科学技术大学;2007年
5 范志广;超高频射频识别(RFID)中的若干问题研究[D];浙江大学;2007年
6 李季平;基于数字图像处理的叶片三维大位移测量研究[D];南京航空航天大学;2009年
7 吴北平;GPS网络RTK定位原理与数学模型研究[D];中国地质大学;2003年
8 田学东;光学公式识别技术研究[D];河北大学;2007年
9 刘光辉;OFDM系统中相位噪声的影响与抑制研究[D];电子科技大学;2005年
10 李南希;非特定人的自然书写脱机中文文本行识别[D];华南理工大学;2010年
中国硕士学位论文全文数据库 前10条
1 喻志强;印刷体数学公式识别的研究与实现[D];沈阳工业大学;2012年
2 徐旭明;在线手写数学公式识别的研究[D];淮北师范大学;2010年
3 吴丽红;印刷体数学公式特殊结构的分析与重构[D];河北大学;2009年
4 侯利昌;印刷体数学公式识别系统的设计与实现[D];大连理工大学;2004年
5 郭志峰;中文扫描印刷体文档中数学公式的特征提取及定位[D];广西师范大学;2010年
6 崔键;印刷体数学公式中矩阵结构分析方法的研究[D];河北大学;2009年
7 崔林卫;Web数学公式提取方法的研究[D];兰州大学;2012年
8 朱并队;印刷体数学表达式识别系统的设计与实现[D];大连理工大学;2005年
9 刘志伟;数学搜索引擎研究[D];兰州大学;2011年
10 赵卫海;基于神经网络的数学公式符号分割与识别系统[D];大连理工大学;2002年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026