一个特征有两个可选的值,只需满足其中一个即可,该如何处理?

  统计/机器学习 特征选择 Python    浏览次数:3294        分享
0

比如,

    car_length    label

0    1                  1

1    2                  0

2    1.5,2            1

car_length 这个特征可以是0行是1,1行是2, 2行是1,2(代表取1或者2都可以)。

我想用一些树模型进行拟合,比如,gdbt,xgboost,请问该如何对car_length 这个特征进行处理?


 

rosefun   2018-05-28 20:33



   1个回答 
1

如果是数值的话,可以取这两个的平均值或者最大值或者最小值。

然后你看交叉验证的结果,哪个好就用哪个。

SofaSofa数据科学社区DS面试题库 DS面经

sasa   2018-05-29 05:27

好的,感谢! - rosefun   2018-05-31 11:18


  相关讨论

对于组合特征怎么理解?

什么情况下需要做特征选择?

wrapper特征选择法是什么意思?

特征组合的重要性排序

分类问题 特征怎么选择

SHAP可以解释二元分类模型吗?

partial dependence是什么意思?

在分类问题中,有什么方法可以得到特征的重要性?

shap值为负是什么意思,可以删掉的意思吗

不同模型下的特征重要性是不同的吗?

  随便看看

K-means怎么选K?

seaborn.distplot直方图的y轴的数值是什么意思?

怎么在已有的dataframe中插入一个新列(Pandas)

python里怎么计算曼哈顿距离?

为什么自然常数e等于阶乘的倒数的和?