图像分割(imaging segment) 可以对图片数据进行裁剪,增多训练的数据量么

  统计/机器学习 监督式学习 深度学习 计算机视觉    浏览次数:6137        分享
0

图像分割可以对图片进行裁剪,增加训练的数据量么

 

xiecl   2018-08-28 17:37



   2个回答 
3

图像分割不能从几何空间的维度(长宽高)增加训练数据,比如cnn这类patch based算法,已经用了所有的已定义大小的数据块(patch)。我的理解,图像分割可增加特征信息:

1.一维像素点属于某类/某区域的标签(class/region label)

2.是否是边沿(edge)

3.整个class/region的统计量,比如mean,variance。

我觉得主要看应用,然后设计要添加的信息。

SofaSofa数据科学社区DS面试题库 DS面经

Zealing   2018-08-28 22:01

图像分割的标签也是图像,比如二分类,是一个二值图像,通过裁剪增加训练数据量,应该相应的对标签的图像进行相同裁剪? - xiecl   2018-08-28 22:28
不理解“通过剪裁增加训练数据量”什么意思。图像在几何空间上是以像素为单位,每个像素的特征由RGB变为RGBL,L表示class label,二元时为0/1。 - Zealing   2018-08-28 23:06
剪裁就是对图像去掉一部分,比如通常是左上角之类四个角落,还有中间部分,总共就可以得到五个部分,也就是说数据从一张图片变为了六张,增多训练数据量,比如256*256,就取得[0:240,0:240]然后resize成256*256,那么是不是标签的图像做同样的处理,进行监督训练 - xiecl   2018-08-28 23:27
我觉得xiecl上面这个这个做法OK的,其实是剪裁了边缘外的一些空白,然后再拉伸,其实这个就是是data augmentation的常用方法,Transformation和Scaling - maxroot   2018-08-28 23:40
1. 2D图像其实是一个3维矩阵(height*width*depth),其中depth指特征(feature)的深度,比如RGB。如果你通过segmentation,还可以增加一个label特征,变为RGBL。在2D空间(height*width)上任何变换,RGBL都要保持一致。所以标签L要和RGB做相同的resize和剪裁变换。 2. 你所说的剪裁所增加的信息来至于resize(241x241->256x256),而不是来至于剪裁。resize是data augmentation的一种,本质上是增加了一层固定参数的convolution layer。 3. resize是能提取不同清晰度(resolution)下信息,但是也加入人造的假信息。所以数据实在太少了,可以用;否则慎用。用多少,则要靠经验。 4.如果你是用CNN,可以设计成Unet或pyramid这要的multi-resolution的网络结构,也可以提取不同resolution下的特征。 - Zealing   2018-08-29 00:32
resize(scaling)是常用的data augmentation,但是它对数据的影响比旋转之类的变换要大。我的感觉是,如果你任务是整个图的classification,那可以用resize。如果是每个pixel都有个目标值(regression)的任务,那就要慎用。 你最好详细描述你的任务。 - Zealing   2018-08-29 00:55
1

通常图片数量不够的时候,我们需要增加训练样本的数量,也就是数据增量(data augmentation)。

如果只是随机剪裁的话,可能会造成图片中的信息(轮廓、边缘)不完整。

数据增量的常用方法是旋转图片、翻转图片、增加噪点、调整图片亮度、灰度等等。

SofaSofa数据科学社区DS面试题库 DS面经

maxroot   2018-08-28 22:14



  相关讨论

Pytorch卷积预测,小样本预测误差小,换一个大样本误差就下降不下去了。

pip install opencv报错

CNN中reLU层和max pooling层的前后顺序

cnn没有pooling会怎么样?

VGG16和VGG19的区别?

图像识别和深度学习中的“组合爆炸”是什么意思?

Resnet-18, Resnet-50, Resnet-101这些模型里的数字是什么意思?

如何安装pytorch

有什么好的方法识别图片中的特殊点呢

图像处理中rgba是什么意思?

  随便看看

micro和macro F1 score分别是什么意思?

hyperparameter与parameter的区别?

KNN中K值的选择

什么是混淆矩阵(confusion matrix)

怎么在已有的dataframe中插入一个新列(Pandas)