查看: 152|回复: 1

[转载] 深度学习中图像语义分割基准数据集详解

[复制链接]
论坛徽章:
6
智慧眼徽章
日期:2018-11-01 14:18:00python徽章
日期:2018-12-20 15:14:57智慧眼徽章
日期:2019-01-03 15:43:14智慧眼徽章
日期:2019-05-09 14:33:41人工智能徽章
日期:2019-08-29 14:44:05OpenCV徽章
日期:2019-10-11 09:56:39
发表于 2019-9-9 07:51 | 显示全部楼层 |阅读模式

模型 算法 测试 计算机 深度学习

前言
图像语义分割是计算机视觉最经典的任务之一,早期的图像分割主要有以下几种实现方法。
基于像素分布的分割算法:KMeans、Fuzzy C Means、 GMM、MeanShift
基于图像拓扑结构的分割算法:分水岭填充、轮廓边缘分析
基于能量较大化的分割方法:图割

但是随着深度学习的兴趣,最近几年传统的图像分割方法已经很少被人提起,现在开始学习图像分割的都是基于深度学习的各种模型实现,这其中模型的训练需要大量的数据,所以想要了解图像分割,首先需要了解图像分割那些质量较好的各种数据集。这些数据集有的作为benchmark 可以很公平的比较各种语义分割模型的性能与精度,评价一个模型的好坏。
数据集分类与汇总
这些数据集的标注多数都是基于像素级别的标签,也有的是基于点级别的标签。语义分割针对不同的任务,数据集分为如下三类:

  • 2D RGB图像数据集
  • 2.5D或者RGB-D的深度图像数据集
  • 纯立体或者3D图像数据集
这些数据集总的列表如下:

2D/RGB数据集
图像语义分割多数都是针对二维的图像进行过,所以2D 数据集是数据集类别最多的,这里2D包括RGB彩色与灰度图像。
PASCAL Visual Object Classes(VOC)数据集
PASCAL VOC数据集支持五种不同的视觉任务训练包括图像分类、对象检测、图像分割、行为分类、人体Layout。分割是预测图像种每个像素属于哪个类别的任务,VOC数据集总计有21个类别(包括背景)。分割数据集被分为训练与测试两个子集,分别有1464与1449张图像。
PASCAL Context数据集
它是PASCAL VOC 2010数据集的扩展,包含10103张基于像素级别标注的训练图像,它包含总数540个类别,其中59个类别是常见类别,被大量标注,整个类别图像的数据符合幂次法则分布。
SBD (Semantic Boundaries Dataset)数据集
它的数据来自那些在PASCAL VOC中没有被语义分割标注的图像数据,总计有11355张图像来自PASCAL VOC 2011,实现了两个层级的标注分布是种类/类别与实例对象分割,其中8498张为训练集,2857张为测试集。
COCO(Microsoft Common Objects in Context)数据集
是微软发布的图像分类、对象检测、实例分割、图像语义的大规模数据集,其中图像分割部分有80分类,82783张训练图像、40504张验证图像,测试集好感80000张图像,而且测试集本身被分为四种不同测试数据,分别应对开发测试、标准测试、评估挑战、过拟合测试。
Cityscapes
一个大规模的城市道路与交通语义分割数据集,8大类别30种类的像素级别标注,数据集包含5000张精准标注的图像,20000张标注图像。数据收集来自50多个城市,前后花了几个月的时间,对这个时间线与天气下的场景都进行图像采集,最初原始的数据是视频方式,通过人工选择视频帧,得到最终的数据。整个数据集支持三个级别的分割性能评估

  • 像素级别分割
  • 实例级别分割
  • 全景级别分割

回复

使用道具 举报

论坛徽章:
6
智慧眼徽章
日期:2018-11-01 14:18:00python徽章
日期:2018-12-20 15:14:57智慧眼徽章
日期:2019-01-03 15:43:14智慧眼徽章
日期:2019-05-09 14:33:41人工智能徽章
日期:2019-08-29 14:44:05OpenCV徽章
日期:2019-10-11 09:56:39
 楼主| 发表于 2019-9-9 07:51 | 显示全部楼层
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册 新浪微博登陆

本版积分规则

 

GMT+8, 2019-10-18 07:08 , Processed in 0.132754 second(s), 29 queries .