公开/公告号CN114863547A
专利类型发明专利
公开/公告日2022-08-05
原文格式PDF
申请/专利权人 武汉众智数字技术有限公司;
申请/专利号CN202210286402.7
申请日2022-03-22
分类号G06V40/20(2022.01);G06V10/26(2022.01);G06V10/74(2022.01);G06V10/82(2022.01);G06N3/08(2006.01);
代理机构北京汇泽知识产权代理有限公司 11228;
代理人秦曼妮
地址 430074 湖北省武汉市东湖新技术开发区珞喻路546号
入库时间 2023-06-19 16:16:00
法律状态公告日
法律状态信息
法律状态
2022-08-23
实质审查的生效 IPC(主分类):G06V40/20 专利申请号:2022102864027 申请日:20220322
实质审查的生效
2022-08-05
公开
发明专利申请公布
技术领域
本发明涉及视频图像处理技术领域,具体涉及一种去除骑行者的目标检测方法及系统。
背景技术
目标检测是计算机视觉领域中一个新兴的应用方向,在人脸检测,行人检测,车辆检测,遥感检测等方面有着十分广泛的应用,其任务是找出图像中所有感兴趣的目标(物体),确定它们的类别和位置。
在步态识别算法的研究开发中目标检测也是尤为重要的,步态识别算法旨在通过人们走路的姿态进行身份识别,与其他的生物识别技术相比,步态识别具有非接触远距离和不容易伪装的优点。但是目前的目标检测算法,会将骑行者也检测为行人类别,会增加不必要的计算量。
发明内容
鉴于现有技术中存在的技术缺陷和技术弊端,本发明实施例提供克服上述问题或者至少部分地解决上述问题的一种一种去除骑行者的目标检测方法及系统,具体方案如下:
作为本发明的第一方面,一种去除骑行者的目标检测方法,所述方法包括:
步骤1,使用coco数据集对神经网络进行训练,得到用于识别车和人的网络模型;
步骤2,将待检测的图片或视频使用自适应缩放的方法剪裁填充为网络大小后输入到步骤1得到的网络模型,得到并保留检测为人和车的结果;
步骤3,通过人车匹配算法检测所述人是否为骑行者,并去除检测为骑行者的人,得到去除骑行者后的行人检测结果。
进一步地,步骤1包括:
步骤1.1,用coco数据集对yolov5l网络进行训练,得到.pt文件的最优模型best.pt;
步骤1.2,将最优模型best.pt转化为.wts文件,得到best.wts后生成对应的.engine文件,即为序列化之后用于识别车和人的的网络模型。
进一步地,步骤1.1中,在训练时,coco数据集中图片或视频的预设大小为640*640,初始学习率lr=0.01,权重衰减系数weight_decay=0.0005,批处理大小batch_size=16,epoch=300,学习率动量momentum=0.937。
进一步地,步骤2还包括:将待检测的图片或视频使用自适应缩放的方法剪裁填充为预设大小,具体为:
根据网络模型的网络宽高和待检测的图片或视频帧宽高的比例得到自适应缩放因子r_w和r_h;然后根据自适应缩放因子得到自适应缩放宽高;最后对图像进行缩放,并添加最少的黑边填充至所述网络宽高。
进一步地,步骤3中,通过人车匹配算法检测所述人是否为骑行者具体包括:
将网络模型检测出来的人和分别放入两个不同的容器里;
计算检测为人的目标框位置检测为车的目标框的位置,基于测为人的目标框位置检测为车的目标框的位置进行位置匹配计算,确定所述人是否为骑行者。
作为本发明的第二方面,提供一种去除骑行者的目标检测系统,所述系统包括:模型训练模块、检测模块和匹配模块;
所述模型训练模块用于,使用coco数据集对神经网络进行训练,得到用于识别车和人的网络模型;
所述检测模块用于将待检测的图片或视频使用自适应缩放的方法剪裁填充为网络大小后输入到步骤1得到的网络模型,得到并保留检测为人和车的结果。
所述匹配模块用于通过人车匹配算法检测所述人是否为骑行者,并去除检测为骑行者的人,得到去除骑行者后的行人检测结果。
进一步地,所述模型训练模块具体用于:用coco数据集对yolov5l网络进行训练,得到.pt文件的最优模型best.pt;将最优模型best.pt转化为.wts文件,得到best.wts后生成对应的.engine文件,即为序列化之后用于识别车和人的的网络模型。
进一步地,在训练时,coco数据集中图片或视频的预设大小为640*640,初始学习率lr=0.01,权重衰减系数weight_decay=0.0005,批处理大小batch_size=16,epoch=300,学习率动量momentum=0.937。
进一步地,所述检测模块还用于:将待检测的图片或视频使用自适应缩放的方法剪裁填充为预设大小,具体为:
根据网络模型的网络宽高和待检测的图片或视频帧宽高的比例得到自适应缩放因子r_w和r_h;然后根据自适应缩放因子得到自适应缩放宽高;最后对图像进行缩放,并添加最少的黑边填充至所述网络宽高。
进一步地,通过人车匹配算法检测所述人是否为骑行者具体包括:
将网络模型检测出来的人和分别放入两个不同的容器里;
计算检测为人的目标框位置检测为车的目标框的位置,基于测为人的目标框位置检测为车的目标框的位置进行位置匹配计算,确定所述人是否为骑行者。
本发明具有以下有益效果:
1.通过加入人车匹配算法,将检测出的人和车进行一一匹配,删除与车匹配上的人的目标框,保留行走的人的目标框,这相较对比于制作行人和骑行者的数据集后训练,耗时较短的同时具有较好的去除骑行者的效果。
2.运用本发明的算法在步态识别的研发中,既保证检测精度,又提高了步态识别算法的整体效率。
附图说明
图1为本发明实施例提供的一种去除骑行者的目标检测方法的流程图;
图2为发明实施例提供的YOLOv5l网络结构图;
图3发明实施例提供的图片自适应剪裁对比图;
图4发明实施例提供的人车匹配算法流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
如图1所示,作为本发明的第一实施例,提供一种去除骑行者的目标检测方法,所述方法包括:
步骤1,使用coco(Common Objects in Context,是微软团队提供的一个可以用来进行图像识别的数据集,以下简称coco)数据集对神经网络进行训练,得到用于识别车和人的网络模型;
步骤2,将待检测的图片或视频使用自适应缩放的方法剪裁填充为网络大小后输入到步骤1得到的网络模型,得到并保留检测为人和车的结果;
步骤3,通过人车匹配算法检测所述人是否为骑行者,并去除检测为骑行者的人,得到去除骑行者后的行人检测结果。
其中,步骤1中,coco数据集为带有标注的COCO2017数据集,分为训练集,测试集和验证集,对数据集进行分析,利用Mosaic,Cotout,矩形训练以及改变亮度,对比度,饱和度等方式增强图像。
步骤1具体包括:
步骤1.1,用coco数据集对如图2所示的yolov5l网络进行训练,得到.pt文件的最优模型best.pt;
步骤1.2,将最优模型best.pt转化为.wts文件,得到best.wts后生成对应的.engine文件,即为序列化之后用于识别车和人的的网络模型。
其中,在训练时,coco数据集中图片或视频的预设大小为640*640,初始学习率lr=0.01,权重衰减系数weight_decay=0.0005,批处理大小batch_size=16,epoch=300,学习率动量momentum=0.937。
其中,步骤2还包括:将待检测的图片或视频使用自适应缩放的方法剪裁填充为预设大小,具体为:
根据网络模型的网络宽高和待检测的图片或视频帧宽高的比例得到自适应缩放因子r_w和r_h;然后根据自适应缩放因子得到自适应缩放宽高;最后对图像进行缩放,并添加最少的黑边填充至所述网络宽高。
如图3所示,自适应缩放因子计算公式如下:
float r_w=float(nCacheW)/ptBgr->m_width;
float r_h=float(nCacheH)/ptBgr->m_height;
其中nCacheW,nCacheH为网络宽高,m_width,m_height为当前帧宽高;
如图4所示,其中,通过人车匹配算法检测所述人是否为骑行者具体包括
如图4中第1步,将检测出来的人即class_id=0和车即class_id=1,2,3分别放入两个不同的容器里;
步骤3.1,如图4第3步的匹配计算中设检测为人的目标框位置为(x1,y1,w1,h1),检测为车的目标框的位置为(x2,y2,w2,h2);则人和车的中心坐标分别为(x1+w1/2,y1+h1/2)和(x2+w2/2,y2+h2/2);当x1-x2+(w1-w2)/2<=T且y1-y2+(h1-h2)/2<=(h1+h2)/2时匹配成功,本发明中T=25。
步骤3.2:人与车匹配成功就删除该索引下标的人的目标框信息,匹配失败则继续匹配,跳出如图4中的判断条件为--所有人和车都互相进行过匹配算法;
步骤3.3,人与车匹配成功就删除该索引下标的人的目标框信息,匹配失败则继续匹配,跳出如图4中的判断条件为--所有人和车都互相进行过匹配算法。
作为本发明的第二实施例,还提供一种去除骑行者的目标检测系统,所述系统包括:模型训练模块、检测模块和匹配模块;
所述模型训练模块用于,使用coco数据集对神经网络进行训练,得到用于识别车和人的网络模型;
所述检测模块用于将待检测的图片或视频使用自适应缩放的方法剪裁填充为网络大小后输入到步骤1得到的网络模型,得到并保留检测为人和车的结果。
所述匹配模块用于通过人车匹配算法检测所述人是否为骑行者,并去除检测为骑行者的人,得到去除骑行者后的行人检测结果。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
机译: 一种学习方法和学习设备,用于将另一辆自动驾驶汽车的空间检测结果与通过V2V通信获取的自己的自动驾驶汽车的空间检测结果进行积分,以及一种使用该学习方法和学习设备的测试方法和测试设备。将通过V2V通信从其他自治车辆获取的目标检测信息与当前自主车辆生成的目标检测信息集成在一起的装置,测试方法和测试装置,使用相同的方法
机译: 利用基于振动传感器的主动阈值的目标检测系统,该方法能够通过逐步通知目标状态的风险来降低假警报的发生率,并提供了一种目标检测方法
机译: 轻便,便携式,可折叠,加压流体输送系统,供徒步旅行者,跑步者,骑自行车的人或需要定期补水的其他应用按需使用