首页> 中文学位 >基于视觉注意力机制的行人再识别研究
【6h】

基于视觉注意力机制的行人再识别研究

代理获取

摘要

公共安全是一个国家社会稳定和经济繁荣发展的前提,旨在预防和管控社会犯罪和各类事故,保障人民的生命及财产安全。如今,国内智能监控系统的日益完善为公共安全保驾护航,其主要职能是自动的对监控数据进行分析。行人再识别,作为智能监控系统的主要应用之一,已经成为学术界一项极具挑战性的研究课题。行人再识别主要是利用计算机视觉技术来判断无重叠区域摄像头下的多个人是否为同一个人,从而进一步进行跟踪、运动轨迹预测等任务。如何从行人图片中提取具有区分性特征表示是行人再识别任务的核心。然而在实景场景中,行人再识别的面临诸多挑战,包括行人姿态变化、背景干扰、光照强度、拍摄角度等等。这些挑战使得有关行人再识别的研究受到学术界的广泛关注。 本文从人类视觉观察规律中得到启发,在卷积神经网络(Convolutional Neural Network,简称CNN)的基础上结合视觉注意力机制,提出基于注意力引导模型的行人再识别方法,探索更具区分性的行人特征表示。另一方面,使用网络瘦身策略和模型压缩算法进一步优化网络结构,在保证精度的前提下减少参数,加快图片处理速度,有利于行人再识别方法的应用部署。本文主要研究内容包括视觉注意力引导模型和网络优化两个方面: (1)视觉注意力机制模仿人类视觉观察方式,在观察和识别过程中时会忽视全局信息和背景信息,有选择性的把视觉注意力集中在物体的某些部分,通过对物体局部信息的综合理解得到对整个物体的理解。对于基于CNN的行人识别问题,视觉注意力引导模型能有针对性的弱化出无用的信息或是背景的干扰,让CNN更集中于行人突出信息的特征学习。本文的视觉注意力机制设计采用行人掩码图片作为注意力源,通过设计的多尺度注意力引导网络生成包含行人特征显著性分布的注意力比重分布图。在基准网络上,使用注意力比重分布图来引导最后的行人特征表示。实验部分证明了视觉注意力引导模型的有效性。该模型能获取更具识别能力的特征表示,并有效的减缓了背景干扰等问题,提高了最后的识别性能。 (2)在视觉注意力引导模型的基础上,使用网络瘦身方法和模型压缩的算法和来优化网络结构。论文采用结构精简和等效替换的方法来实现网络瘦身,采用基于通道剪枝的模型压缩算法对模型进行网络优化。在保障精度的同时有效降低参数冗余,提高了模型速度,进一步优化了所提出的行人再识别方法。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号