图像分割(imaging segment) 可以对图片数据进行裁剪，增多训练的数据量么-SofaSofa

图像分割可以对图片进行裁剪，增加训练的数据量么

xiecl 2018-08-28 17:37

2个回答

图像分割不能从几何空间的维度（长宽高）增加训练数据，比如cnn这类patch based算法，已经用了所有的已定义大小的数据块（patch）。我的理解，图像分割可增加特征信息：

1.一维像素点属于某类/某区域的标签（class/region label）

2.是否是边沿（edge）

3.整个class/region的统计量，比如mean，variance。

我觉得主要看应用，然后设计要添加的信息。

SofaSofa数据科学社区 DS面试题库 DS面经

Zealing 2018-08-28 22:01

图像分割的标签也是图像，比如二分类，是一个二值图像，通过裁剪增加训练数据量，应该相应的对标签的图像进行相同裁剪？ - xiecl 2018-08-28 22:28

不理解“通过剪裁增加训练数据量”什么意思。图像在几何空间上是以像素为单位，每个像素的特征由RGB变为RGBL，L表示class label，二元时为0/1。 - Zealing 2018-08-28 23:06

剪裁就是对图像去掉一部分，比如通常是左上角之类四个角落，还有中间部分，总共就可以得到五个部分，也就是说数据从一张图片变为了六张，增多训练数据量，比如256*256，就取得[0:240,0:240]然后resize成256*256，那么是不是标签的图像做同样的处理，进行监督训练 - xiecl 2018-08-28 23:27

我觉得xiecl上面这个这个做法OK的，其实是剪裁了边缘外的一些空白，然后再拉伸，其实这个就是是data augmentation的常用方法，Transformation和Scaling - maxroot 2018-08-28 23:40

1. 2D图像其实是一个3维矩阵（height*width*depth），其中depth指特征（feature）的深度，比如RGB。如果你通过segmentation，还可以增加一个label特征，变为RGBL。在2D空间（height*width）上任何变换，RGBL都要保持一致。所以标签L要和RGB做相同的resize和剪裁变换。 2. 你所说的剪裁所增加的信息来至于resize（241x241->256x256），而不是来至于剪裁。resize是data augmentation的一种，本质上是增加了一层固定参数的convolution layer。 3. resize是能提取不同清晰度（resolution）下信息，但是也加入人造的假信息。所以数据实在太少了，可以用；否则慎用。用多少，则要靠经验。 4.如果你是用CNN，可以设计成Unet或pyramid这要的multi-resolution的网络结构，也可以提取不同resolution下的特征。 - Zealing 2018-08-29 00:32

resize（scaling）是常用的data augmentation，但是它对数据的影响比旋转之类的变换要大。我的感觉是，如果你任务是整个图的classification，那可以用resize。如果是每个pixel都有个目标值（regression）的任务，那就要慎用。你最好详细描述你的任务。 - Zealing 2018-08-29 00:55

通常图片数量不够的时候，我们需要增加训练样本的数量，也就是数据增量(data augmentation)。

如果只是随机剪裁的话，可能会造成图片中的信息（轮廓、边缘）不完整。

数据增量的常用方法是旋转图片、翻转图片、增加噪点、调整图片亮度、灰度等等。

SofaSofa数据科学社区 DS面试题库 DS面经

maxroot 2018-08-28 22:14

图像分割(imaging segment) 可以对图片数据进行裁剪，增多训练的数据量么

Warning

2个回答

Warning

Warning