地震后建筑修复建议

地震后建筑修复建议


比赛概述


本比赛为个人练习赛,主要针对于数据新人进行自我练习、自我提高,与大家切磋。

练习赛时限:2018-05-02 至 2020-05-02

任务类型:多元分类

背景介绍:
人工智能的落地不仅在于“下棋”、“开车”,还可以参与地震的灾后重建。本次练习赛基于外国某次大地震后100余万座建筑的数据,任务是给每个灾后建筑提出不同的修复指导建议(如:无需处理、小规模修复、大规模修缮、重建)。


   


数据下载


数据文件(三个):
train.csv 训练集,文件大小 34.7mb
test.csv 预测集, 文件大小 20.6mb
sample_submit.csv 提交示例 文件大小 1.9mb

下载该数据即同意不以商业为目的传播、发布该数据集。

训练集中共有652936座建筑,预测集中有400000座建筑。

变量说明:
变量名 解释
id 编号
district_id 建筑所在地区的编号。
area_id 建筑所在片区的编号。一个地区包含多个片区。
floors_before 地震前该建筑的楼层数。
floors_after 地震后该建筑的楼层数。
age 该建筑建成年数
area 该建筑占地面积
height_before 地震前该建筑的高度(英尺)。
height_after 地震后该建筑的高度(英尺)。
land_condition 建筑所在的地表状况。F表示平地,M表示斜坡,S表示陡坡。
foundation_type 地基类型。M表示泥砂石,C表示砖土,R表示水泥,B表示木材,O表示其他。
roof_type 建筑屋顶类型。L表示茅草屋顶,H表示木屋顶,R表示混凝土、砖楼顶。
ground_floor_type 建筑一楼的结构类型。M表示泥砂,R表示混凝土,B表示砖,T表示木质,O表示其他。
position 建筑与其他建筑的位置关系。表示多少个建筑与该建筑相连接。
y 专家给出的修复建议。0表示无需修复,1表示小修复,2比赛大规模修缮,3表示重建。这是需要被预测的标签。


选手的任务是提交预测集中每个建筑的修复建议和修复建议。格式应与sample_submit.csv一致。主修复建议对应sample_submit.csv中的y1列,次修复建议对应y2列。

train.csv, test.csv均为逗号分隔形式的文件。在python中可以通过如下形式读取。
train = pd.read_csv('train.csv')
test = pd.read_csv('test.csv')


评价方法


您提交的结果为每个建筑的主、次修复建议(主、次建议不得相同),都为0到3的整数。评价标准为map@2。map@k也是推荐系统中常用的评价标准

简单来说,对于每一个建筑,若主修复意见正确,得1分;若次修复意见正确,得0.5分;若都不正确,记0分。所有建筑的得分的均值就是map@2。


提交结果


提交前请确保预测结果的格式与sample_submit.csv中的格式一致,以及提交文件后缀名为csv。文件大小不超过5mb。

您提交的结果为两列,第一列为y1,第二列为y2。行的顺序须与test.csv中的行的顺序一致。文件较大时,可能上传时间较长,请耐心等待。

   文件名不可以包含中文字符,长度在20字节以内。

排行榜每两小时更新一次。每次更新之前,参赛选手可以多次上传预测结果,但是系统只保留排行榜更新之前最后一次上传结果。

   

每次比赛为练习赛,所以评测结果是基于全部400000条预测样本。