图像分割可以对图片进行裁剪,增加训练的数据量么
2个回答
图像分割不能从几何空间的维度(长宽高)增加训练数据,比如cnn这类patch based算法,已经用了所有的已定义大小的数据块(patch)。我的理解,图像分割可增加特征信息:
1.一维像素点属于某类/某区域的标签(class/region label)
2.是否是边沿(edge)
3.整个class/region的统计量,比如mean,variance。
我觉得主要看应用,然后设计要添加的信息。
SofaSofa数据科学社区DS面试题库 DS面经
图像分割的标签也是图像,比如二分类,是一个二值图像,通过裁剪增加训练数据量,应该相应的对标签的图像进行相同裁剪?
-
xiecl
2018-08-28 22:28
不理解“通过剪裁增加训练数据量”什么意思。图像在几何空间上是以像素为单位,每个像素的特征由RGB变为RGBL,L表示class label,二元时为0/1。
-
Zealing
2018-08-28 23:06
剪裁就是对图像去掉一部分,比如通常是左上角之类四个角落,还有中间部分,总共就可以得到五个部分,也就是说数据从一张图片变为了六张,增多训练数据量,比如256*256,就取得[0:240,0:240]然后resize成256*256,那么是不是标签的图像做同样的处理,进行监督训练
-
xiecl
2018-08-28 23:27
我觉得xiecl上面这个这个做法OK的,其实是剪裁了边缘外的一些空白,然后再拉伸,其实这个就是是data augmentation的常用方法,Transformation和Scaling
-
maxroot
2018-08-28 23:40
1. 2D图像其实是一个3维矩阵(height*width*depth),其中depth指特征(feature)的深度,比如RGB。如果你通过segmentation,还可以增加一个label特征,变为RGBL。在2D空间(height*width)上任何变换,RGBL都要保持一致。所以标签L要和RGB做相同的resize和剪裁变换。
2. 你所说的剪裁所增加的信息来至于resize(241x241->256x256),而不是来至于剪裁。resize是data augmentation的一种,本质上是增加了一层固定参数的convolution layer。
3. resize是能提取不同清晰度(resolution)下信息,但是也加入人造的假信息。所以数据实在太少了,可以用;否则慎用。用多少,则要靠经验。
4.如果你是用CNN,可以设计成Unet或pyramid这要的multi-resolution的网络结构,也可以提取不同resolution下的特征。
-
Zealing
2018-08-29 00:32
resize(scaling)是常用的data augmentation,但是它对数据的影响比旋转之类的变换要大。我的感觉是,如果你任务是整个图的classification,那可以用resize。如果是每个pixel都有个目标值(regression)的任务,那就要慎用。
你最好详细描述你的任务。
-
Zealing
2018-08-29 00:55
通常图片数量不够的时候,我们需要增加训练样本的数量,也就是数据增量(data augmentation)。
如果只是随机剪裁的话,可能会造成图片中的信息(轮廓、边缘)不完整。
数据增量的常用方法是旋转图片、翻转图片、增加噪点、调整图片亮度、灰度等等。
SofaSofa数据科学社区DS面试题库 DS面经