收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

模拟人类视觉感知的行人图像显著结构的研究及应用

薄一航  
【摘要】:人类在感知外界环境的过程中,80%以上的信息来自于视觉。人类视觉感知系统中,初级视皮层从眼睛接收来自外界的信息,并按照由初级到中级,再由中级向高级的顺序分级进行信息处理。点和边缘是构成图像最基本的初级视觉特征,这些初级视觉特征经过编组形成边界及区域等中级视觉特征,以区域等中级视觉特征为基础,结合构成目标的各部分之间的结构关系,最终形成完整的目标。行人图像是各类自然图像中最常见、应用范围最广的一类,面对任何一幅复杂而陌生的行人图像,人们均可迅速、准确地找出其中有用的、属于目标本身的边缘、边界以及区域等显著结构,通过对这些显著结构的研究与分析,来完成整个行人目标的解析工作。 如何模拟人类的视觉感知过程让计算机代替人工完成这一系列看似简单而实际复杂的工作是计算机视觉主要解决的问题。本文借鉴生物物理学和认知心理学的相关理论,结合概率统计等数学知识对此过程进行建模,通过对行人图像中的显著点、显著边缘、显著边界、显著区域等初级与中级视觉特征的研究与分析来实现对整个行人目标的解析,并将该解析模型应用于行人目标的分割、行人行走朝向预测以及行人目标检测的再估计等高级视觉处理过程中。其中,显著点与显著边缘为属于目标轮廓或者图像中不同区域边界上的点与边缘,边缘上所包含的显著点越多,其显著性也就越强;显著边界为构成目标轮廓的边界;而显著区域则为属于目标或者前景本身的区域。 本文的主要工作包括以下三个方面: 1)提出了基于认知心理学中格式塔规则的行人图像显著边缘等初级视觉特征的检测方法。首先使用尺度空间边缘(Scale Space Edges, SSE)与张量投票(Tensor Voting, TV)相结合的方法对行人图像中的显著点进行检测,并根据格式塔规则中“好的形状(Good Shape)"的原理,以边缘上包含显著点的情况、边缘的长度、光滑性以及稳定性等为线索对边缘的显著性加以判断,提出一种基于边缘能量与边缘稳定性的显著边缘的检测方法;对于背景、目标内部纹理和颜色比较复杂的图像,仅从长度、光滑性等边缘本身的特征出发很难得到理想的实验结果。鉴于此,进一步提出一种基于初级与中级视觉特征的显著边缘的检测方法。通过分析各边缘两侧区域内颜色与纹理的差异,并根据格式塔规则中的“闭合性(Closure)”原理对图像中的显著边缘进行检测。上述研究成果在行人图像和不同类别的图像中均进行了验证。该方法的优点在于不仅考虑到边缘本身的特性,还综合了颜色、纹理等能直接体现区域特性的初级视觉特征,所得到的显著边缘不仅节省了存储空间,还为下一步显著边界的检测提供了线索。 2)提出了一种行人图像中显著边界等中级视觉特征的检测方法。显著边缘可以为高级的目标匹配、目标识别等工作提供线索,但很难直接应用于目标的解析与分割,因此,本文以显著边缘作为线索之一,对更加连续、光滑的组成目标轮廓的显著边界进行检测与分析。首先通过改变由gPb-OWT-UCM分层分割算法得到的分层分割图的阈值,产生一组软边界,然后分别对这组边界所包含显著边缘的情况,以及其长度、光滑性等属性进行度量,并根据知觉组织中的“接近律”原则对其进行编组,检测出其中属于同一个目标整体的显著边界。分别将检测到的显著边界和真实显著边界的形状与样本库中样本的形状进行匹配。通过显著边界的检测将图像分成了不同的区域,这些区域的形状及显著性可以为更高一级的视觉处理任务提供有力线索。 3)提出了基于显著区域形状的行人目标解析模型及其在高级视觉处理过程中的应用。与基于语义的解析模型不同,本文提出一种基于句法的解析模型,其基本思想是将行人分成若干可视单元,并将这些可视单元归纳为永久部分与可能部分两种类型。根据知觉的整体性原理,模拟人类视觉感知过程,以永久部分为刺激起点,引发对目标其它可能部分的联想与推测,从而感知到整个目标。具体实现方法如下:首先以gPb-OWT-UCM分层分割算法得到的分割区域为基础,保留形状较显著的区域块,然后按照行人的树形解析结构,自底向上,从单个部分的形状出发,依次考虑各个部分组合的形状,直至整个行人的形状,最终解析出整个行人目标及其各个组成部分。本文还将该解析模型很好地应用于行人目标及其各个组成部分的分割,行人行走朝向的预测,以及行人目标检测的再估计等高级视觉处理过程中,这些实验结果均验证了该模型的有效性。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 娄莉;党瑞荣;;基于智能图像处理技术的车型识别[J];微电子学与计算机;2006年06期
2 魏立梅,张永瑞,谢维信,程相君;人脸识别中边缘检测器的改进[J];西安电子科技大学学报;1998年02期
3 吴冰,秦志远;自动确定图像二值化最佳阈值的新方法[J];测绘学院学报;2001年04期
4 吴剑波,李明鸣,赵宏,谭玉山;立体视觉三维测量系统中的数据获取技术[J];仪器仪表学报;2001年S2期
5 邵清亮;张芝贤;刘四新;;基于视频图像处理的油田井管长度测量研究[J];仪表技术;2007年12期
6 陈亮;杜宇人;;改进背景补偿的车牌图像二值化算法[J];扬州大学学报(自然科学版);2008年01期
7 范宜艳;刘文超;邬文俊;;基于液晶系统的规则点编码技术研究[J];湖北工业大学学报;2008年02期
8 贾佳;白瑞林;黄晓江;赵洁;;嵌入式机器视觉实用彩色图像二值化方法[J];江南大学学报(自然科学版);2011年01期
9 赵雪松,陈淑珍;综合全局二值化与边缘检测的图像分割方法[J];计算机辅助设计与图形学学报;2001年02期
10 蔡波,朱玉玉;车牌识别中的快速区域定位方法研究[J];西南科技大学学报;2004年02期
11 安宁;林树忠;刘海华;崔慧;;图像处理方法研究及其应用[J];仪器仪表学报;2006年S1期
12 祁蒙;刘鑫;姜学东;;灰度梯度自适应阈值二值化算法的FPGA实现[J];激光与红外;2008年09期
13 谢莹;;一种新的基于佳点集的图像二值化遗传算法[J];计算机技术与发展;2008年12期
14 刘婧;秦华标;;基于灰度直方图的几何特征人眼定位方法[J];微计算机信息;2009年09期
15 蔡广宇;崔世林;;基于互信息的焊缝图像处理及其GPU实现[J];焊接技术;2010年10期
16 张伟,高航;基于图像处理技术的自动报靶系统设计和实现[J];南京航空航天大学学报;2000年06期
17 张莉;谭新莲;周文晖;刘济林;;一种改进的均值偏移算法及其应用[J];南京理工大学学报(自然科学版);2008年01期
18 辛颖;薛伟;;贮木场原木楞堆图像计数技术[J];林业机械与木工设备;2008年04期
19 吴斌斌;刘伟;;指纹预处理中特征值的提取[J];中国科技信息;2009年21期
20 沈红雷;;纸币号码识别技术研究[J];科技信息;2009年36期
中国重要会议论文全文数据库 前10条
1 曹成茂;缪鹏程;孙燕;刘辉;洪翎;;基于叶片面积的温室植物水分监测系统的研究[A];纪念中国农业工程学会成立30周年暨中国农业工程学会2009年学术年会(CSAE 2009)论文集[C];2009年
2 李军;;基于二维直方图的指纹图像二值化[A];全国第二届信号处理与应用学术会议专刊[C];2008年
3 朱军民;黄磊;刘昌平;;图像二值化方法比较[A];第八届全国汉字识别学术会议论文集[C];2002年
4 张敏;王锡淮;肖健梅;;一种集装箱箱号定位及字符切割技术[A];2009中国控制与决策会议论文集(2)[C];2009年
5 吕俊哲;;图像二值化算法研究及其实现[A];山西省科学技术情报学会学术年会论文集[C];2004年
6 吴剑波;李明鸣;赵宏;谭玉山;;立体视觉三维测量系统中的数据获取技术[A];中国仪器仪表学会第三届青年学术会议论文集(下)[C];2001年
7 刘玉红;王志芳;熊兴良;王颖;李虹;李章勇;赵志强;谢正祥;;图像的带参二值化理论和技术及其医学应用[A];中国生物医学工程进展——2007中国生物医学工程联合学术年会论文集(上册)[C];2007年
8 张卫;杜尚丰;;Hough变换在农田机械视觉导航中的应用[A];第三届全国信息获取与处理学术会议论文集[C];2005年
9 范宜艳;刘文超;邬文俊;;基于液晶系统的规则点编码技术研究[A];湖北省机械工程学会设计与传动学会、武汉机械设计与传动学会2008年学术年会论文集(1)[C];2008年
10 王晓卫;张志虎;贾红光;;SSDA算法在某型空地导弹模拟训练系统的应用[A];2009系统仿真技术及其应用学术会议论文集[C];2009年
中国博士学位论文全文数据库 前10条
1 薄一航;模拟人类视觉感知的行人图像显著结构的研究及应用[D];北京交通大学;2011年
2 计长安;基于PRIC理论的图像信息技术研究[D];上海交通大学;2006年
3 刘博;乳腺超声图像中的肿瘤区域定位与肿瘤分类技术研究[D];哈尔滨工业大学;2010年
4 刘立波;基于图像的水稻叶部病害诊断技术研究[D];中国农业科学院;2010年
5 赖富强;电成像测井处理及解释方法研究[D];中国石油大学;2011年
6 贾鑫;智能车辆视觉感知中的车道标线识别方法的研究[D];吉林大学;2008年
7 张麒;动脉粥样硬化研究中的医学图像处理[D];复旦大学;2010年
8 赵晓芳;视网膜血管图像处理的若干关键问题研究[D];华南理工大学;2011年
9 康锋;基于视觉特征的早期农林火灾检测方法的基础研究[D];浙江大学;2010年
10 安秋;农业机器人视觉导航系统及其光照问题的研究[D];南京农业大学;2008年
中国硕士学位论文全文数据库 前10条
1 陈侃;基于模糊计算的文本图像二值化方法研究与应用[D];北方工业大学;2010年
2 郭便;加工表面显微视觉图像三维重建与粗糙度检测[D];西安理工大学;2010年
3 王李;SMT/BGA焊点X-Ray视觉检测软件系统设计[D];西南交通大学;2010年
4 张文浩;光学遥感图像跑道提取与油罐目标识别技术研究[D];电子科技大学;2010年
5 孙自强;图像轮廓线压缩方法的研究[D];天津大学;2004年
6 刘新刚;光纤阵列激光靶测试系统研究[D];中北大学;2011年
7 田俊霞;两个图像分割算法的研究与实现[D];华东师范大学;2002年
8 严曲;身份证识别系统的原理及算法研究[D];中南大学;2005年
9 贾春晖;基于CCTV的大桥安全警戒系统的研究[D];大连海事大学;2011年
10 王可;基于机器视觉与图像分析的原棉异纤检测[D];东华大学;2010年
中国重要报纸全文数据库 前10条
1 穆纹;如何挑选旅游数码MP3[N];中国旅游报;2003年
2 峥嵘;MP3激情走过2003[N];中国电子报;2003年
3 本报记者 杜杰;邻家有女初长成[N];计算机世界;2004年
4 彭丹梅;“大兴农业”品牌亮相农业精品博览[N];农民日报;2005年
5 吴思、杨春、王雁凌;掀起多媒体检索革命[N];中国计算机报;2002年
6 陈世鸿;自由的动感影像[N];中国摄影报;2005年
7 陈伟 蓝天;中国房地产业需要品牌文化[N];中国房地产报;2007年
8 展悦;城市“色彩规划”不得随意[N];江苏经济报;2007年
9 阳小毛;水彩特质的雨雾欧洲[N];美术报;2007年
10 陈宇峰;不惜代价争漂亮的社会理性[N];上海证券报;2007年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978