首页> 中文学位 >基于生物视觉感知机制的图像理解技术研究
【6h】

基于生物视觉感知机制的图像理解技术研究

代理获取

摘要

场景理解是计算机视觉中具有挑战性的难点问题,是相关视觉应用的关键环节。动物能迅速地对所处的场景做出判断并响应,准确获取目标对象的位置和类型,这是目前最先进的计算机视觉系统无法媲美的。本文以认知生理学和心理学的研究成果为基础,从图像理解与认知学的相互关系入手,根据动物视觉感知系统中的重要结构和功能机理研究图像理解的关键技术。
  本文首先深入研究了人类视觉的认知生理学结构和视觉感知机制。视网膜是视觉信息的起始点,主要存在三种细胞获取视野中不同的图像特征信息,通过LGN中的对应通道传送至初级视皮层的V1区域。视觉皮层中的腹侧通路用来形成感受和进行对象识别,分别经历了Vl、V2、V3或V4(中颖叶区)、顶叶皮层(OPC)或下颖叶皮层(IT)的视觉信息传递过程;背部通路处理动作和其它的空间信息;各层次之间存在着前向、水平和反馈的交互作用。因此人类的视觉感知系统不仅具有层次型结构特点,还具有侧抑制和反馈的特性,可以实现快速有效的视觉感知。
  其次重点研究了基于视皮层感知机制的彩色图像分割模型。提出了一种基于多特征的层次化彩色图像感知分割模型,该方法有效的利用图像的亮度空间分布、细节信息以及颜色空间信息,对图像进行初次分割,并利用BPNN模型对多特征分割结果进行融合选择,得到最终的分割结果。另外,结合Trickle-down视觉理论,研究了结合自底向上和自顶向下的BU&TD彩色图像分割模型,使用特定类特征片段实现了自顶向下的分割,更好的模拟了视觉机制的反馈过程。
  此外,本文在对现有生物激励目标识别模型进行深入分析的基础上,提出了生物激励的多特征场景分类模型,模型包括两个阶段的处理过程,首先模拟生物低级视觉区域,并行独立的提取图像的三种属性进行场景分类,然后根据三个分割结果进行二次分类,以提高分类的准确性;结合OFC的预测机制和场景上下文信息,研究了基于生物视觉机制的BU&TD目标识别模型,模型在训练阶段建立特定类目标图像的LSF库和GIST特征库,系统自动学习目标的先验知识和上下文信息,在测试阶段,提取输入图像低频特征、上下文特征分别映射到 PHC和OFC做出预测,再结合高频细节特征完成目标的识别过程。
  最后对本文的研究特色进行了描述,对本文的研究工作进行了总结,分析了各模型的实验结果,指出了模型的优点和缺点,并对下一步的工作进行了展望。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号