混合监督表面缺陷检测研究总结
一、模型结构
本文提出一种适用于工业表面缺陷检测的端到端混合监督深度学习模型,核心架构为两个子网络组成:
- 分割子网(Segmentation Sub-network): 负责像素级缺陷定位。
- 分类子网(Classification Sub-network): 基于分割特征图进行图像级分类。
关键机制包括:
- 动态平衡损失:训练前期侧重分割学习,后期逐步转向分类。
- 梯度流截断:防止分类误差影响分割网络稳定性。
- 像素损失加权:考虑粗糙标注区域中心重要性,引入距离变换。
- 支持弱标签(图像级)与强标签(像素级)混合训练。
二、数据集介绍
表 1:实验使用的数据集概况
数据集 |
正样本数 |
负样本数 |
标注类型 |
难度评估 |
DAGM (1-6) |
450 |
3000 |
椭圆区域 |
中等(合成图) |
DAGM (7-10) |
600 |
4000 |
椭圆区域 |
中等 |
KolektorSDD |
52 |
347 |
旋转矩形框 |
中等(真实裂纹) |
KolektorSDD2 |
356 |
2979 |
像素级掩码 |
高(真实多种缺陷) |
Severstal Steel |
4759 |
6666 |
像素级或框标注 |
高(真实工业图) |
三、实验结果与对比分析
DAGM 数据集平均精度(AP)与准确率(CA)比较
表 2:DAGM 数据集各方法性能对比
方法 |
监督类型 |
平均精度 AP (%) |
准确率 CA (%) |
Uninformed Students |
无监督 |
66.8 |
79.3 |
CADN-W32 |
弱监督 |
69.0 |
89.1 |
本文方法 (N = 0) |
弱监督 |
74.0 |
85.4 |
本文方法 (N = 5) |
混合监督 |
91.5 |
88.1 |
本文方法 (N = 15) |
混合监督 |
100.0 |
100.0 |
Kim 等 |
全监督 |
— |
99.9 |
本文方法 (全监督) |
全监督 |
100.0 |
100.0 |
其他数据集结果摘要
表 3:其他数据集关键结果(AP)
数据集 |
监督类型 |
标注样本数 N |
平均精度 AP (%) |
KolektorSDD |
弱监督 |
0 |
93.4 |
KolektorSDD |
混合监督 |
5 |
99.1 |
KolektorSDD2 |
弱监督 |
0 |
73.3 |
KolektorSDD2 |
混合监督 |
16 |
83.2 |
Severstal Steel |
弱监督 |
0 |
90.3 - 94.1 |
Severstal Steel |
混合监督 |
50 |
94.2 |
Severstal Steel |
全监督 |
全部 |
98.7 |