基于改进Mask R−CNN算法对堆叠汽车零件的实例分割方法

朱新龙 崔国华 陈赛旋 杨琳

朱新龙, 崔国华, 陈赛旋, 杨琳. 基于改进Mask R−CNN算法对堆叠汽车零件的实例分割方法[J]. 上海工程技术大学学报, 2022, 36(2): 168-175. doi: 10.12299/jsues.21-0309
ZHU Xinlong, CUI Guohua, CHEN Saixuan, YANG Lin. Instance segmentation method based on improved Mask R−CNN for the stacked automobile parts[J]. Journal of Shanghai University of Engineering Science, 2022, 36(2): 168-175. doi: 10.12299/jsues.21-0309
基金项目: 上海市自然科学基金项目资助(18030501200);江苏省重点研发计划项目资助(BE2020082-3)

    朱新龙(1995−),男,在读硕士,研究方向为机器人视觉. E-mail:1070485584@qq.com

  • 中图分类号: TP242

Instance segmentation method based on improved Mask R−CNN for the stacked automobile parts

    针对堆叠汽车零件识别检测与分割速度慢、精度低及鲁棒性差等问题,提出一种基于改进Mask R−CNN算法对堆叠汽车零件快速检测与实例分割的方法. 首先,对Mask R−CNN中的特征提取网络进行优化,将ResNet + 特征金字塔网络(Feature Pyramid Networks,FPN)替换成MobileNets + FPN作为骨干网络,有效减少网络参数并压缩模型体积,提高模型检测的速度;然后,通过在Mask R−CNN的ROI Align结构后加入空间变换网络(Spatial Transformer Networks,STN)模块,保证模型的检测精度. 试验结果表明,改进后压缩了模型的尺寸,识别检测速度提升了1倍;模型的平均精度均值(Mean Average Precision,mAP)较改进前也有所提升. 对未经训练的新样本进行检测,结果表明该模型速度上优于Mask R−CNN,且更轻量和精准,能够快速准确地实现对堆叠汽车零件检测与分割,验证了改进模型的实际可行性.

  • 图  1  数据集中的样本

    Figure  1.  Parts in data set

    图  2  各种数据增强方法效果图

    Figure  2.  Renderings of various data enhancement methods

    图  3  标注示例图

    Figure  3.  Annotation example diagram

    图  4  深度可分离卷积

    Figure  4.  Depthwise separable convolution

    图  5  STN模块

    Figure  5.  STN module

    图  6  MobileNets和FPN特征融合图

    Figure  6.  Feature fusion map of MobileNets and FPN

    图  7  改进Mask R−CNN网络架构

    Figure  7.  Improved Mask R−CNN network architecture

    图  8  损失函数值

    Figure  8.  Loss function value

    图  9  被检测零件实例分割过程

    Figure  9.  Instance segmentation process of detected parts

    图  10  改进前后多目标零件检测精度

    Figure  10.  Comparison of AP values before and after improvement

    图  11  汽车零件识别分割效果图

    Figure  11.  Auto parts recognition segmentation effect diagrams

    图  12  改进前后识别准确率对比

    Figure  12.  Comparison of recognition accuracy before and after improvement

    表  1  训练集、验证集和测试集的组成

    Table  1.   Composition of training, validation and test set

    表  2  数据集格式

    Table  2.   Dataset format

    表  3  修改后MobileNets的5个阶段

    Table  3.   Five stages of modified MobileNets

    1 224 × 224 × 3 Conv 3 × 3 × 3 × 32/2 V1
    112 × 112 × 32 Convd 3 × 3 × 32/1
    112 × 112 × 32 Conv 1 × 1 × 32 × 64/1
    2 112 × 112 × 64 Convd 3 × 3 × 64/2 V2
    56 × 56 × 64 Conv 1 × 1 × 64 × 128/1
    56 × 56 × 128 Convd 3 × 3 × 128/1
    56 × 56 × 128 Conv 1 × 1 × 128 × 128/1
    3 56 × 56 × 128 Convd 3 × 3 × 128/2 V3
    28 × 28 × 128 Conv 1 × 1 × 128 × 256/1
    28 × 28 × 256 Convd 3 × 3 × 256/1
    28 × 28 × 256 Conv 1 × 1 × 256 × 256/1
    4 28 × 28 × 256 Convd 3 × 3 × 256/2 V4
    14 × 14 × 256 Conv 1 × 1 × 256 × 512/1
    14 × 14 × 512 Convd × 5 3 × 3 × 512/1
    14 × 14 × 512 Conv × 5 1 × 1 × 512 × 512/1
    5 14 × 14 × 512 Convd 3 × 3 × 512/2 V5
    7 × 7 × 512 Conv 1 × 1 × 512 × 1024/1
    7 × 7 × 1024 Convd 3 × 3 × 1024/1
    7 × 7 × 1024 Conv 1 × 1 × 1024 × 1024/1
    表  4  改进前后模型大小及检测时间对比

    Table  4.   Comparison of model size and detection time before and after improvement

    参数Mask R−CNN改进的Mask R−CNN
    表  5  改进前后识别准确率对比

    Table  5.   Comparison of recognition accuracy before and after improvement

图(12) / 表(5)
  • 收稿日期:  2021-12-27
  • 网络出版日期:  2022-11-16
  • 刊出日期:  2022-06-30


