基于改进的粗网格印刷体藏文字符识别技术研究
【摘要】:
文字识别是集模式识别、图像处理与文字处理技术相结合的一种新技术,是模式识别和人工智能领域的一个重要研究方向。在西方文字和汉字印刷体识别经过多年的探索和实践已走向实用化的今天,藏文识别因其字型的结构复杂、相似字的比例高等原因,一直是字符识别中一个具有挑战性的难题。
本文在现有印刷体藏文识别技术的基础上,对藏文字符的预处理、特征提取和分类识别算法进行了具体的研究,提出了一种基于改进的粗网格印刷体藏文字符特征提取算法。主要完成的工作如下:
(1)文中首先讨论了藏文字符图像的预处理,研究了二值化、平滑、行字切分和归一化的不同方法,并对不同的方法做了比较,选择了最适合后文处理印刷体藏文字符的预处理方法,预处理后将得到大小统一的藏文字符图像。
(2)文中对前人提出的三种特征提取方法:图像投影法、方向线素法和分形矩法分析了它们的优缺点,然后提出了一种基于改进的粗网格的藏文字符特征提取算法。实验结果表明用该方法提取的字符特征能有效地减少因图像中像素位置变化造成的识别率下降的影响,并在一定程度上克服了藏文相似字符过多而造成的误识别率过高的缺点。
(3)由于提取的原始特征存在冗余,会降低识别率和识别速度,为此,要对原始特征进行特征选择。本文利用主成分分析来选择特征,并进行了仿真实验。
(4)分类器的设计是模式识别中比较重要的问题。在分类器设计过程中,可以采用不同的特征选择方法和不同的分类算法以及使用的不同的度量方法,文中采用了BP神经网络分类器。
最后,文中用改进的粗网格法对藏文进行特征提取、选择和识别,进行了多次藏文字符的识别实验,并与方向线素法做了比较。实验结果表明,改进后的粗网格法在对印刷体藏文字符进行分类识别时,具有较高的识别率和识别速度。
|
|
|
|
1 |
周建兴,廖敦明,刘瑞祥,陈立亮;变网格技术在温度场数值模拟中的应用[J];热加工工艺;2000年04期 |
2 |
逯贵祯,蒋克华;TLM方法中不同网格之间的匹配研究[J];北京广播学院学报(自然科学版);1998年02期 |
3 |
王胜源;李玉山;曹剑中;;混合有限差分方法及其在微带电路分析中的应用[J];仪器仪表学报;2010年07期 |
4 |
胡振稳;尹朝庆;;基于BP神经网络的车牌字符识别的研究[J];电脑知识与技术(学术交流);2007年02期 |
5 |
杨芳;李红睿;田学东;;基于RBF神经网络的汉字粗分类方法[J];计算机工程与应用;2009年06期 |
6 |
周新海;周新国;;Euler方程的多网格数值解法[J];计算机工程与科学;1989年02期 |
7 |
周建兴,廖广兰,刘瑞祥,陈立亮;有限差分问题中的变网格技术[J];热加工工艺;1999年06期 |
8 |
蒲海;单威俊;李锋;冷文浩;刘渊;;基于过渡边的细化算法及其在舱口角隅处的应用[J];计算机应用与软件;2009年02期 |
9 |
杨晓辉,王正华,王承尧;PVM平台下粗网格修正与拼接网格相匹配解超声速底部流场[J];数值计算与计算机应用;2000年01期 |
10 |
徐正权;多重网格区域分裂分布式计算[J];数值计算与计算机应用;1996年01期 |
11 |
刘真真;王茂基;李永忠;沈晔华;;基于分形矩的印刷体藏文特征提取方法[J];模式识别与人工智能;2008年05期 |
12 |
李杰;周洲;;结构化多重网格粘性流场数值模拟[J];计算机仿真;2009年03期 |
13 |
刘泓,方敏,梁朝军;基于Rough集的车牌字符识别方法[J];合肥工业大学学报(自然科学版);2004年10期 |
14 |
刘真真;李永忠;沈晔华;;基于分形矩的印刷体藏文特征提取方法[J];江南大学学报(自然科学版);2007年06期 |
15 |
王玉雷;李永忠;王汝山;;粗网格在印刷体藏文特征提取中的应用[J];科学技术与工程;2009年18期 |
16 |
张庆兵;一种解Euler方程的高效算法[J];现代防御技术;1992年01期 |
17 |
朱培烨;三维非结构网格的欧拉方程聚合多重网格法[J];航空计算技术;2004年03期 |
18 |
刘真真;李永忠;沈晔华;;分形矩在印刷体藏文特征提取中的应用[J];江苏科技大学学报(自然科学版);2008年02期 |
19 |
钟志鹏;马昌凤;何婵;;求解二阶椭圆奇性问题的组合网格法[J];桂林电子科技大学学报;2008年05期 |
20 |
廉闻宇;;两维含激波流动的数值模拟——两维PBLM方法[J];数值计算与计算机应用;1990年02期 |
|
|
|
|
|
1 |
本报记者 汪洪华;告别经验时代[N];中国计算机报;2000年 |
|