基于深度学习的车位智能检测方法

徐乐先; 陈西江; 班亚; 黄丹

doi:doi:10.3788/CJL201946.0404013

中国激光, 2019, 46 (4): 0404013, 网络出版: 2019-05-09

基于深度学习的车位智能检测方法下载： 1579次

Method for Intelligent Detection of Parking Spaces Based on Deep Learning

论文大纲

徐乐先 ^1,*陈西江 ^1,*班亚 ²黄丹 ³

作者单位

¹ 武汉理工大学资源与环境工程学院, 湖北武汉 430079

² 重庆市计量质量检测研究院, 重庆 401120

³ 武汉理工大学图书馆, 湖北武汉 430079

AI 词云图 AI一句话精读 AI短摘要

注：本部分内容由 AI 自动生成，请您知悉。

摘要

提出了一种基于深度学习的车位智能检测方法。利用TensorFlow深度学习平台对车辆目标识别模型进行了训练,提取了有效车辆图像的优化间隔,给出了车辆分布的精准识别结果,实现了对车辆分布识别结果的有序编号和车位空缺状况的准确判断。利用模拟数据和实际采集数据,分别验证了车位分布的智能识别、车位智能编号和空车位判断的可靠性。

Abstract

Based on deep learning, one method for the intelligent detection of parking spaces is proposed. The TensorFlow deep learning platform is applied to train the car object recognition model, the optimal interval of the effective car images is extracted, the accurate recognition result of the car distribution is presented, and the order numbering of the recognition results of the car distribution and the accurate judgment of the vacancy situation of parking spaces are realized. The simulation results and the actually collected data are adopted to verify the reliability of intelligent identification of parking space distribution, intelligent numbering of parking space, and the judgement of empty parking space.

1 引言

近年来,随着城市规模的扩大,城市中车辆数量也呈爆炸式增长,但是停车场的数量和停车位智能化水平发展与之不相称。当车主不能及时找到停车位时,汽车会处于低速巡游状态或者反复启停状态,产生大量的尾气排放并造成交通拥堵。此矛盾不能简单地通过增建车位的方法去解决。因此,为了减轻车主寻找空车位的难处,提升停车场内停车位的智能化管理水平显得尤为重要。智能停车场管理系统的核心功能是实现车位引导和车位检测,国内外停车场使用的车位检测技术主要分为基于传感器和基于图像2种。第一种技术需要大量的传感器单元覆盖整个停车场,一个传感器一次仅能检测一个停车位且易受环境干扰,铺设繁琐,成本高;第二种技术由于摄像头覆盖范围广,仅需要几个摄像头,有时甚至一个就可以实现整个停车场车位的检测,并且在许多情况下,出于安全监控的目的,监控设施已安装在许多停车场中,因此面向视频监控的车位识别系统不仅能达到安全监控的目的,还能使视频监控增值,实现车位引导的功能。这种检测技术目前在国内应用不多,但随着物联网技术的普及与发展,越来越多的停车场将使用监控视频来实现车位检测。

国际上,2007年,True^[1]提出了静态图像中的空置停车位检测方法,该方法采用汽车特征点检测和颜色直方图分类组合方式进行车位检测,实现了个别车位的估算检测,但无法满足智能停车场的车位检测要求。2008年,Bong等^[2]提出了一种停车场占用信息系统,该系统使用灰度值作为阈值以检测区分车位占用或空位,同时也使用了Sobel边缘检测,如果边缘像素的百分比超过总像素的5%,则视车位已被占用,该方法最大的缺点是室外停车场中识别效果较差。2009年,Ichihashi等^[3]提出了一种新型摄像机系统(ParkLotD),该系统采用基于模糊C均值聚类分类器和粒子群优化调整超参数,提高了室内车位检测效果,实现了室外空车位检测的实用性。2013年,Almeida等^[4]基于文献[ 5]提出基于纹理特征描述符的车位检测方法,该方法所用的描述符包括局部二进制模式和局部相位量化。2015年,Shaaban等^[6]提出了利用摄像机获取的灰度图像进行车位检测的方法,成功识别了在不同场景和天气条件下的空置和占用停车位。该方法测试了两种算法,第一种算法基于图像直方图的最大值,第二种算法基于图像直方图的带宽。其优点是该检测系统的算法简单,配置简单,不需要高质量的图像,可使用较便宜的摄像机或现有的监控摄像机代替特殊摄像机,从而节省了大量成本;缺点是若空置停车位出现一个或多个人时,图像检测就会出现问题。2018年,Karakaya等^[7]提出了一种使用深度学习检测停车位占用率的方法,该方法通过在嵌入式系统上运行循环神经网络来对停车场图像进行处理,进而简单地收集停车场可用性信息,但该方法没能在车位分布识别和各车位空车位检测信息具体的输出方面做更多的研究。

国内,2008年,蒋大林等^[8]提出基于视频图像的多特征车位检测算法,实现了停车位检测。该方法通过比较视频图像中被监控的车位内有无车辆的几何形状特点和纹理特征来进行空车位占用情况的判断,优点是在复杂背景和不同环境条件下,识别效果好,运算速度快,缺点是没能验证检测多个车位的情况。2014年,叶卿等^[9]提出了借助辅助识别图案的计算机视觉车位检测方法,实现了停车位检测。该方法利用停车位上绘制的特定辅助识别图案作为检测目标,该图案在大部分光照、阴影的影响下具备图案特征不变性,然后采用图像识别算法,逐行扫描各个像素,利用模式匹配判断停车位状态。其优点是只储存车位区域的多边形,存储小,在地下停车场等光照环境比较恶劣的条件下具有良好的应用前景;缺点是对于大型的露天停车场,停车位多使得布置辅助识别图案工作量大,且图案位于地面容易被人、积水、积雪等障碍物遮挡,使得实际应用中车位检测会出错。2015年,丁元舟等^[10]提出利用车位范围内差影的均值和车位区域内边缘点数两种判据的车位检测方法,实现了车位的检测,该方法的不足之处在于车位检测时受外界环境影响较大,例如停车位出现人或其他物体时就会出现识别错误的问题。2018年,安旭骁等^[11]提出一种将深度学习应用于停车场空车位检测中,实现车位检测的方法。该方法利用卷积神经网络在图像分类中的优势,对空车位和已占用车位的图片数据集进行识别模型的训练,达到对空车位与已占用车位的识别分类。其优点是相对于传统的神经网络计算量小,正确率高,对摄像头的配置要求不高,经济性好;缺点是由于不同停车场的空车位图片信息不同,针对不同的停车场需采集不同的图像集进行网络的训练,训练量相对较大,除此之外,不同的停车场必须要对视频帧图手动设置掩码,通过边缘检测切割成单个车位图,智能性较低,适用性不强。

自2012年ImageNet举办的图像分类竞赛中深度学习系统赢得冠军后,深度学习开始受到学术界广泛的关注。物体识别的难度比图像分类更高,在ImageNet数据集上,深度学习不仅实现了图像分类,也实现了物体识别。图像分类只需判断图片中包含哪一种物体,但进行物体识别时,还要给出所包含物体的具体位置,且一张图片中可能出现多个需要识别的物体^[12]。本文利用深度学习在目标识别方面的优越性,通过深度学习训练的目标识别网络模型对优化提取的监控摄像图像数据进行识别,结合数据分层法、Timsort算法以及空车位概率判别模型,实现停车场车位分布的智能识别、车位智能编号和空车位信息的输出。

2 理论基础

深度学习训练的目标识别网络模型中,目标检测结构有Faster R-CNN(Region-Convolutional Neural Networks)^[13]、R-FCN(Region-based Fully Convolution Network)^[14]、SSD(Single Shot Multibox Detector)^[15]等,这些结构需要一个主干网络来提取特征,如VGG16(Visual Geometry Group 16)^[16-17]、ResNet(Residual Neural Network)^[18]、InceptionV1^[19]、InceptionV3^[20-21]、Inception Resnet^[22]、MobileNet^[23]等。TensorFlow通过计算图的形式表述计算的深度学习框架,所有的计算都会转化为计算图上的节点,其目标检测API(Application Programming Interface)项目提供了多种经COCO数据库训练的网络结构(表1),因此不必单独为Faster-RCN、R-FCN、SSD搭建框架,在这些基础上修改相关参数即可训练目标识别模型。表1中COCO mAP[^1]表示该模型在COCO数据集上经标准mAP(mean Average Precision)度量的检测性能,其值越大检测效果越好。

表 1. COCO训练的部分模型

Table 1. COCO-trained partial models

Model name	Speed /ms	COCO mAP[^1]
ssd_mobilenet_v1_coco	30	21
ssd_resnet_50_fpn_coco	76	35
ssd_inception_v2_coco	42	24
ssdlite_mobilenet_v2_coco	27	22
faster_rcnn_inception_v2_coco	58	28
faster_rcnn_resnet50_coco	89	30
rfcn_resnet101_coco	92	30

查看所有表

2.1 SDD检测框架

SDD检测框架是由Liu等^[15]提出的一种快速高效的检测方法,基于前馈神经网络得出的预测框集合和检测类别的概率值,通过非极大值抑制得到最终检测结果。根据文献[ 24],其他目标检测结构(包括Faster-RCNN、R-FCN等)虽然结构精度高,但耗时比较长,而SDD检测框架在处理大目标时明显比其他结构快,只是在处理小目标时检测效果比较差。由于检测目标为车辆,且考虑车位判别的实时性,选用SSD作为检测框架。

2.2 MobileNet模型

MobileNet模型是由Howard等^[23]提出的一种小尺寸的移动优先性视觉模型,采用深度可分离卷积神经网络并引入宽度因子α和分辨率因子ρ来减少参数数目和计算量,以此构建规模更小、速度更快的网络模型。该模型相对于传统卷积结构的不同之处在于:将一般的卷积操作分解成Depthwise卷积和1×1的Pointwise卷积两个独立模块进行计算,都在输出后加入批标准化(BN)^[20]和非线性激活函数来构建网络。BN的主要作用就是使学习率更高且避免模型爆炸,引入宽度因子和分辨率因子,优化计算量并加速训练过程,在处理训练样本时也起正则化作用。

假设D_F为输入的宽和高,D_k为卷积核的宽和高,M为输入通道的数量,N为某层所用的卷积核个数,则标准卷积的计算量为:D_k×D_k×M×N×D_F×D_F,而经过深度可分离卷积运算,卷积操作的分解使得Depthwise卷积和Pointwise卷积这两种组合方式的计算总量为:D_k×D_k×M×D_F×D_F+M×N×D_F×D_F,可知深度可分离卷积与标准卷积的计算比率γ为1/N+1/ $\begin{matrix} D_{k}^{2} \end{matrix}$ ,深度可分离卷积使得计算量大量减少。

作用于网络通道数的宽度因子的取值是0~1,作用于输入的特征图的分辨率因子的取值是0~1,引入这两者后的计算总量为:D_k×D_k×αM×ρD_F×ρD_F+αM×αN×ρD_F×ρD_F。MobileNet模型大幅度减少了网络参数数量和计算量,表2所示为MobileNet模型与通用模型的对比,可知MobileNet模型精度并未明显降低。

表 2. MobileNet模型与通用模型的对比

Table 2. Comparison between MobileNet and popular models

Model	1.0 MobileNet-224	GoogleNet	VGG16
ImageNetaccuracy /%	70.6	69.8	71.5

查看所有表

综上所述,针对停车场车位识别的大目标、实时性等特点,选择使用TensorFlow中SDD_MobileNet目标检测API,下载SDD_Mobilenet_V1_COCO预训练模型。

3 基于视频流的车位识别系统整体概述

视频流的车位识别系统的关键在于通过深度学习训练目标识别模型,应用时通过编程调用识别模型对目标进行识别,再利用识别的数据分析判断出停车位的分布和车位空缺状况。

详细识别流程设计如图1所示,流程简述如下:1)通过调用OpenCV库,读入视频流;2)根据车位是否已经被识别的情况选择车位识别或直接进行空车位判断;3)对视频流进行优化读取,将帧图像保存并输出,为识别做准备;4)进行车位识别,调用已训练的车辆识别网络模型,对帧图像进行识别并保存识别数据;5)对车位识别数据进行排序编号处理并对处理后的车位数据进行可视化;6)将可视化后的车位识别数据与输出帧图像中的实际停车位分布进行对比,判断是否要进行车位的重新识别,若需重新识别,则提取下一帧图像再次进行车位识别,直至车位分布与实际吻合时进入空车位判断循环中。

基于深度学习的车位智能检测方法 下载： 1579次

1 引言

2 理论基础

表 1. COCO训练的部分模型

Table 1. COCO-trained partial models

2.1 SDD检测框架

2.2 MobileNet模型

表 2. MobileNet模型与通用模型的对比

Table 2. Comparison between MobileNet and popular models

3 基于视频流的车位识别系统整体概述

图 1. 车位识别流程

Fig. 1. Flow chart of parking space recognition

4 基于监控视频流数据的车辆图像优化间隔提取

5 模拟分析

5.1 车辆模型的数据集制作

图 2. 车辆模型部分图像。(a)侧视角;(b)俯视角

Fig. 2. Partial images of car models. (a) Side view; (b) top view

5.2 车辆模型的目标检测模型训练

图 3. 总损失值的模拟分析结果

Fig. 3. Simulated result of total loss value

图 4. 训练模型对汽车模型的识别效果。(a)部分验证评估识别;(b)(c)测试目标识别模型;(d)筛选识别的结果

Fig. 4. Recognition effects of training models on car models. (a) Identification of partial verification assessments; (b)(c) test object recognition model; (d) results by filtering and recognition

图 5. 对深度可分离卷积核某层进行BN处理时β的分布图

Fig. 5. Distribution of β in BN processing of one layer in depthwise separable convolution kernel

5.3 模拟车位视频流的读取

5.4 停车场车位的识别、编号和空车位判断

图 6. 模拟满车位时的识别

Fig. 6. Recognition when simulating full parking space

表 3. 图像中车辆模型的对象框信息

Table 3. Information related to car model object boxes in images

表 4. 车位信息的Timsort算法排序编号结果

Table 4. Sorting and numbering results of parking space information by Timsort algorithm

图 7. 车位数据排序编号后的可视化。(a)数据分层法处理前;(b)数据分层法处理后

Fig. 7. Visualization after sorting and numbering of parking space data. (a) Before using data layering method; (b) after using data layering method

表 5. Timsort算法结合数据分层法的排序编号结果

Table 5. Sorting and numbering results by Timsort algorithm combined with data layering method

图 8. 车位占用帧图像

Fig. 8. Frame image about parking space occupancy

图 9. 车辆识别数据的可视化

Fig. 9. Visualization of car identification data

图 10. 空车位概率判断模型。(a)空车位判断示意图;(b)流程

Fig. 10. Probability discriminant model for empty parking spaces. (a) Schematic for discriminating empty parking space; (b) flow chart

图 11. 车位检测结果输出

Fig. 11. Output of parking space detection results

图 12. 利用Canny算子对不同环境下车辆的边缘检测。(a)对图4(a)的边缘检测结果;(b)对图6的边缘检测结果

Fig. 12. Edge detection of cars in different environments by Canny operator. (a) Edge detection result of Fig. 4(a); (b) edge detection result of Fig. 6

6 实例分析

6.1 低视角车位识别

图 13. 实例验证中模型训练及验证。(a)总损失值的变化情况;(b)经25000次迭代训练后的识别效果

Fig. 13. Model training and verification in case verification. (a) Change in total loss value; (b) recognition effect after iterative training for 25000 times

图 14. 停车位识别。(a)满车位帧图像;(b)车位识别数据的可视化

Fig. 14. Parking space recognition. (a) Frame image of full parking space; (b) visualization of identification data for parking spaces

图 15. 某时间点空车位的检测。(a)停车场的车位占用情况;(b)识别车辆对车位的覆盖情况;(c)车位检测结果输出

Fig. 15. Detection of empty parking spaces at some time point. (a) Parking space occupancy; (b) recognized car coverage of parking spaces; (c) output of parking space detection results

6.2 高视角车位识别

图 16. 停车位识别。(a)满车位帧图像;(b)车位识别数据的可视化

Fig. 16. Parking space identification. (a) Frame image of full parking space; (b) visualization of identification data for parking spaces

图 17. 某时间点空车位检测。(a)车位占用情况;(b)识别车辆对车位的覆盖情况;(c)车位检测结果输出

Fig. 17. Detection of empty parking spaces at some time point. (a) Parking space occupancy; (b) recognized car coverage of parking spaces; (c) output of parking space detection results

7 结论

Article Outline

相关论文

相关资讯

关于本站 Cookie 的使用提示

全站搜索

基于深度学习的车位智能检测方法下载： 1579次