地震后建筑修复建议
地震后建筑修复建议
比赛概述
本比赛为个人练习赛,主要针对于数据新人进行自我练习、自我提高,与大家切磋。
练习赛时限:2018-05-02 至 2020-05-02
任务类型:多元分类
背景介绍:
人工智能的落地不仅在于“下棋”、“开车”,还可以参与地震的灾后重建。本次练习赛基于外国某次大地震后100余万座建筑的数据,任务是给每个灾后建筑提出不同的修复指导建议(如:无需处理、小规模修复、大规模修缮、重建)。
数据下载
数据文件(三个):
train.csv 训练集,文件大小 34.7mb
test.csv 预测集, 文件大小 20.6mb
sample_submit.csv 提交示例 文件大小 1.9mb
下载该数据即同意不以商业为目的传播、发布该数据集。
训练集中共有652936座建筑,预测集中有400000座建筑。
变量说明:
变量名 | 解释 |
---|---|
id | 编号 |
district_id | 建筑所在地区的编号。 |
area_id | 建筑所在片区的编号。一个地区包含多个片区。 |
floors_before | 地震前该建筑的楼层数。 |
floors_after | 地震后该建筑的楼层数。 |
age | 该建筑建成年数 |
area | 该建筑占地面积 |
height_before | 地震前该建筑的高度(英尺)。 |
height_after | 地震后该建筑的高度(英尺)。 |
land_condition | 建筑所在的地表状况。F表示平地,M表示斜坡,S表示陡坡。 |
foundation_type | 地基类型。M表示泥砂石,C表示砖土,R表示水泥,B表示木材,O表示其他。 |
roof_type | 建筑屋顶类型。L表示茅草屋顶,H表示木屋顶,R表示混凝土、砖楼顶。 |
ground_floor_type | 建筑一楼的结构类型。M表示泥砂,R表示混凝土,B表示砖,T表示木质,O表示其他。 |
position | 建筑与其他建筑的位置关系。表示多少个建筑与该建筑相连接。 |
y | 专家给出的修复建议。0表示无需修复,1表示小修复,2比赛大规模修缮,3表示重建。这是需要被预测的标签。 |
选手的任务是提交预测集中每个建筑的主修复建议和次修复建议。格式应与sample_submit.csv一致。主修复建议对应sample_submit.csv中的y1列,次修复建议对应y2列。
train.csv, test.csv均为逗号分隔形式的文件。在python中可以通过如下形式读取。
train = pd.read_csv('train.csv')
test = pd.read_csv('test.csv')
评价方法
您提交的结果为每个建筑的主、次修复建议(主、次建议不得相同),都为0到3的整数。评价标准为map@2。map@k也是推荐系统中常用的评价标准。
简单来说,对于每一个建筑,若主修复意见正确,得1分;若次修复意见正确,得0.5分;若都不正确,记0分。所有建筑的得分的均值就是map@2。