目标检测常用数据集及评价指标
目标检测是计算机视觉中的重要任务,其常用数据集和评价指标如下:
一、常用数据集
- COCO (Common Objects in Context)• 特点:包含80类常见物体(如人、车、动物等),超过33万张图像,标注信息丰富(边界框、实例分割、关键点等)。• 场景:复杂背景、多目标、小物体检测。• 用途:通用目标检测基准,学术研究常用。
- PASCAL VOC• 特点:经典数据集,包含20类物体,约1.1万张图像,标注包括边界框和语义分割。• 场景:中等复杂度,适合算法验证。• 用途:目标检测、分割、动作识别等任务。
- ImageNet(目标检测子集)• 特点:ImageNet的检测子集包含200类物体,约50万张图像。• 场景:大规模、多样化的物体类别。• 用途:分类与检测结合的任务。
- KITTI• 特点:专注于自动驾驶场景,包含车辆、行人等9类物体,提供激光雷达点云和图像数据。• 场景:真实道路环境、3D检测。• 用途:自动驾驶领域研究。
- Open Images• 特点:谷歌发布的大规模数据集,包含600类物体,190万张图像,标注包括边界框和关系标注。• 场景:多样化的开放世界场景。• 用途:大规模目标检测与关系理解。
- Cityscapes• 特点:城市场景数据集,包含30类物体(如车辆、行人、道路),5000张高分辨率图像。• 场景:城市道路、精细实例分割。• 用途:自动驾驶与场景理解。
二、评价指标
- IoU(Intersection over Union)• 定义:预测框与真实框的交集面积除以并集面积。• 用途:判断检测是否正确的阈值(通常设为0.5或0.75)。
- AP(Average Precision)• 定义:单类别的平均精度,计算方式为精确率-召回率曲线(PR曲线)下的面积。• 变体:◦ VOC AP:固定IoU=0.5,使用11点插值法。◦ COCO AP:计算IoU在0.5:0.95(间隔0.05)的平均值,更严格。
- mAP(Mean Average Precision)• 定义:所有类别的AP的平均值,衡量模型在多类别检测中的综合性能。
- FPS(Frames Per Second)• 定义:每秒处理的图像帧数,衡量检测速度。
- 其他指标• AR(Average Recall):最大召回率下的平均表现(如AR@100表示每图最多检测100个框时的召回率)。• AP@Small/Medium/Large:针对不同尺寸目标的检测性能(基于COCO标准)。
三、总结
• 数据集选择:根据任务需求选择数据集(如通用检测用COCO,自动驾驶用KITTI)。
• 评价指标:mAP是核心指标,需结合IoU阈值和FPS平衡精度与速度。
• 工具支持:COCO提供官方评估工具(pycocotools
),方便计算指标。
通过合理选择数据集和深入理解评价指标,可以更有效地评估和优化目标检测模型。