形状识别2:方圆之外
形状识别2:方圆之外
比赛概述
本比赛为个人练习赛,主要针对于数据新人、尤其图像处理、识别方面的新手进行自我练习、自我提高,与大家切磋。本比赛是形状识别:是方还是圆的升级任务。
练习赛时限:2018-08-20 至 2020-08-20
任务类型:二元分类、异常检测、图像识别
背景介绍:
我们给出六千张图像作为训练集。每个图像中只有一个图形,要么是圆形,要么是正方形。你的任务是 1)根据这六千张图片训练出一个二元分类模型,并用它(不是用肉眼)在测试集上判断每个图像中的形状是圆还是方;测试集中有些图像既不是圆、也不是方,也请将它们甄别出来。
数据下载
数据文件(三个):
train.csv 训练集,文件大小 34.7mb
test.csv 预测集, 文件大小 30.0mb
sample_submit.csv 提交示例 文件大小 40kb
百度网盘提取密码:35yn 下载该数据即同意不以商业为目的传播、发布该数据集。
或者
Google Drive 下载该数据即同意不以商业为目的传播、发布该数据集。
训练集中共有6000个灰度图像,预测集中有5191个灰度图像。每个图像中都会含有大量的噪点。
图像的分辨率为40x40,也就是40x40的矩阵,每个矩阵以行向量的形式被存放在train.csv和test.csv中。train.csv和test.csv中每行数据代表一个图像,也就是说每行都有1600个特征。
训练集中的图像是圆形或者方形,测试集中的图像除了方形和圆形,还有非方非圆的异形。
方 圆 异形
变量说明:
变量名 | 解释 |
---|---|
id | 编号 |
p_i_j | 表示图像中第i行第j列上的像素点的灰度值,取值范围在0到255之间,i和j的取值都是0到39。 |
y | 表示该图像中的形状。0表示圆形,1表示方形。这是需要被预测的标签。 |
选手的任务是提交预测集中每个图像的标签(而非概率),以0表示圆、1表示方、2表示异形。格式应与sample_submit.csv一致。
train.csv, test.csv均为逗号分隔形式的文件。在python中可以通过如下形式读取。
train = pd.read_csv('train.csv')
test = pd.read_csv('test.csv')
评价方法
您提交的结果为每行的预测标签,也就是0、1、2。评价方法为准确率。