对于组合特征怎么理解?

  统计/机器学习 特征选择    浏览次数:5447        分享
1

众所周知,传统机器学习的主要工作在于特征工程,其中特征工程中进行特征组合往往会对模型的结果带来提升。

举个例子,考虑第一个特征“性别”,男为1,女为0;第二个特征“是否喜欢宠物”,喜欢宠物为1,不喜欢宠物为0。那么组合后构造了“性别_是否喜欢宠物”这个新的维度的特征,这个特征的取值可以是00、01、10、11。

组合特征背后的理论基础是什么呢?怎么更好地去理解组合特征?之前有看到过组合特征可以发现特征与特征之间的关系,从而发现非线性关系,不太理解,谢谢!

 

dzzxjl   2018-04-04 21:00



   1个回答 
1

你说的这个“特征组合”实际上就是interaction term.

interaction在统计和计量经济里是个成熟的话题了,可以参考Wikipedia: Interaction


SofaSofa数据科学社区DS面试题库 DS面经

Nagozi   2018-04-05 04:45



  相关讨论

wrapper特征选择法是什么意思?

什么情况下需要做特征选择?

一个特征有两个可选的值,只需满足其中一个即可,该如何处理?

使用uci的社区犯罪率做回归,怎么选择因变量呢

不同模型下的特征重要性是不同的吗?

在分类问题中,有什么方法可以得到特征的重要性?

SHAP可以解释二元分类模型吗?

shap值为负是什么意思,可以删掉的意思吗

partial dependence是什么意思?

分类问题 特征怎么选择

  随便看看

pandas报错ValueError: Cannot convert non-finite values (NA or inf) to integer

pandas.DataFrame里的loc和iloc什么区别?

xgboost的gblinear是什么意思?

怎么把pandas dataframe中一列英文文本全部转成小写?

ARIMA模型中的三个参数(p, d, q)都是什么意思?