我应该是第一个提交数据集吧,当时是下午在公司看到,快下班了,就直接处理里面文本转换成离散的数字label
然后u盘复制回家随便找了个模型跑了下0.74(0.74是排行榜上的,感觉那个测评指标自己写轮子有点麻烦,懒就没写,测试集直接用准确率了)。
今天闲了,研究了一下测试集,发现几个有意思东西,但也没想到解决对策。
首先是震后楼层会比震前楼层多,我没搞明白...........(train里有,test也有)
其次是震后高度比震前高度高(难道是地震把地壳顶起来了?,不过测楼不是应该只关心地表高度吗)
或者说都是错误数据?
其次就是震前高度,有99(100多个),还有两个一百多米,这个应该是错误值了吧,不过又一看,码的,震后都是0米,修复建议都是重建,。。。。。。。。。难道确实是太高了???
wtf!
3个回答
在公司里玩这个,也是服了你啊
SofaSofa数据科学社区DS面试题库 DS面经
偷着来的,我现在在一家传统企业扣表,做指标,搞代码要趁被人不注意,不然会被认为不务正业→_→
-
陈十一
2018-05-11 09:11