1 福州大学 先进制造学院,福建 泉州 362252
2 中国福建光电信息科学与技术实验室,福建 福州 350116
针对太阳能电池片缺陷检测方法存在精度低的问题,提出一种基于改进的YOLOv5s太阳能电池片表面缺陷检测算法。首先,为了解决电池片小目标缺陷检测问题,提出了上下文Transformer网络(CoT),可以为小目标提供全局上下文信息,帮助模型更好地预测小目标。其次,将CBAM注意力加入到Head部分的C3模块,能够更好地捕捉输入特征图的重要通道和空间位置,提高模型的性能和鲁棒性。接着,使用轻量级的通用上采样算子CARAFE减少上采样过程中特征信息的损失,保证了特征信息的完整性。最后,使用WIoU作为边界框损失函数,大幅提升了回归的准确性,并且有助于快速实现模型的收敛。实验结果显示,改进后的YOLOv5s相较于原始算法在Precision、Recall、mAP@0.5三个指标上分别提高了5.5%、4.1%、3.3%,检测速度达到了76 FPS,满足太阳能电池片缺陷检测要求。
太阳能电池片 YOLOv5s 上下文Transformer网络 CARAFE 损失函数 solar cell YOLOv5s contextual transformer network CARAFE loss function
1 福州大学 先进制造学院,福建 泉州 362200
2 福州大学 物理与信息工程学院,福建 福州 350116
3 中国福建光电信息科学与技术实验室,福建 福州 350116
针对现有图像智能裁剪算法在处理人像图片时,存在误将主要人物整个人或部分身体部位裁减掉等致使图像关键信息缺失和构图不佳的问题,本文提出一种基于人像检测的实时图像智能裁剪方法。该方法将图像裁剪分为人像检测和智能构图两个阶段,旨在将提取的人像坐标信息作为智能裁剪算法的输入,然后结合基于美学的构图法则对图片进行自动构图,确保裁剪结果中人像信息的完整性并提升图片的构图美感。实验结果表明,本文在Center-Net基础上改造的轻量级检测网络,运算量减少了86%,精度提升了3.34%,便于将该裁剪算法应用于移动端设备。整个裁剪算法的FPS达到了77,并且裁剪后的人像信息完整,图片整体构图得到改善。
图像裁剪 人像检测 智能构图 计算机视觉 image cropping human detection image composition computer vision
1 福州大学 先进制造学院, 福建 泉州 362200
2 中国福建光电信息科学与技术实验室, 福州 350116
3 福州大学 物理与信息工程学院, 福州 350116
针对图像目标检测任务中采用的深度学习网络复杂的计算和规模庞大的计算参数, 导致基于ARM架构的嵌入式系统上, 目标检测任务存在着高延时和处理速度慢的问题, 文章提出并设计实现了一种新型完整嵌入式道路车辆检测方案。该方案在基于YOLOv3-Tiny的特征提取网络中采用结构重参数化的方法提升模型检测精度, 并通过Vitis-AI在Zynq嵌入式平台上部署DPUCZDX8G架构的加速核对卷积神经网络的并行加速, 最后将改进的YOLOv3-Tiny网络模型经过量化、编译, 以动态链接库的方式部署。实验结果表明, 在VOC2007上测试最终实现均值平均精度(MAP)为0.597, 实时处理速度为27.7FPS, 同时帧率功耗比为1.49, 适合边缘计算设备的低功耗要求。
目标检测 量化 结构重参数化 target detection Vitis-AI Vitis-AI quantification structural re-parameterization Zynq Zynq
1 福州大学 物理与信息工程学院, 福州 350116
2 中国福建光电信息科学与技术创新实验室, 福州 350116
3 福州大学 先进制造学院, 福建 泉州 362200
为提高单阶段实例分割的检测精度和改善小目标漏检、错检情况, 提出一种基于YOLACT改进的YOLACTR算法。该算法首先利用CNN与Transformer相结合, 设计一种新的头部预测网络, 对特征进一步提取, 并使用双向注意力来关联同一实例的掩码信息并区分不同实例之间的掩码特征, 注重特征点周围的关联信息, 使得检测框的预测更加准确; 然后利用多级上采样和设计的CS注意力模块结合形成掩码分支, 使其融入多种不同尺度信息, 并利用CS注意力来关注不同的尺度信息。在MS COCO数据上, YOLACTR算法与YOLACT算法相比, 其边框和掩码检测精度分别提升了7.4%和2.9%, 在小目标检测上分别提升了18.9%和13.5%。实验表明, YOLACTR算法可以在多目标复杂场景下, 提升检测和分割精度以及分类的准确度, 改善小目标和重叠目标漏检、错检的问题。
实例分割 注意力机制 小目标检测 YOLACT YOLACT instance segmentation Transformer Transformer attention mechanism small target detection
1 福州大学 先进制造学院,福建 泉州 3622001
2 福州大学 物理与信息工程学院,福建 福州 350116
3 中国福建光电信息科学与技术创新实验室,福建 福州 350116
由于光在水下存在吸收与散射,导致水下图像存在颜色失真和细节损失,严重影响了后续水下目标的检测和识别。本文提出了一种轻量级全卷积层的生成式对抗神经网络模型(DUnet-GAN)来增强水下图像。针对水下图像的特点,提出了多任务目标函数,使得模型从感知图像的整体内容、颜色、局部纹理和风格信息等方面来增强图像的质量。此外,与现有的一些重要的模型做了对比,进行了定量的评估。结果表明,在EUVP数据集中本文所提模型峰值信噪比在26 dB以上,结构相似度为0.8,参数量为11 MB,仅为其他达到同等性能模型参数量的5%且比26 MB参数量的FUNIE-GAN指标更好。同时UIQM为2.85,仅次于Cycle-GAN模型,且主观增强效果显著。更重要的是,增强后的图像为水下目标检测等模型提供了更好的性能,也满足了水下机器人等设备对模型的轻量化要求。
生成式对抗神经网络 图像增强 轻量级 生成器 目标检测 generative adversarial networks image enhancement lightweight generator object detection
1 福州大学 物理与信息工程学院, 福州 350116
2 中国福建光电信息科学与技术创新实验室, 福州 350116
3 福州大学 先进制造学院, 福建 泉州 362200
为了解决常见自动白平衡(Auto White Balance, AWB)方法的场景适应能力不足且实时性较差等问题, 提出了一种基于颜色通道直方图重构的自适应AWB方法, 并使用现场可编程门阵列(FPGA)对所提出的算法进行硬件电路实现, 在校正图像白平衡的同时也确保了系统高速实时处理图像。首先对图像进行限制对比度自适应直方图均衡化(CLAHE)处理来提高图像对比度, 然后对图像进行灰度级区间的通道分区统计, 对不同场景类别的图像采用颜色直方图匹配或平移的重构方式做自适应处理。实验结果表明, 该算法在处理图像白平衡时, 相比基于光源估计的AWB算法, 色温校正准确率提高了14%, 对不同色彩场景有更好的适应性, 具有实时处理能力。
自动白平衡 颜色直方图 色温校正 实时处理 automatic white balance color histogram FPGA FPGA color temperature correction real-time processing