在进行数值编码时出现错误,怎么解决?

  统计/机器学习 数据预处理 特征选择 Python    浏览次数:3584        分享
0

'Device_Type','Filled_Form','Gender','Var1','Var2','Mobile_Verified','Source'这些特征类型为object

# 数值编码
from sklearn.preprocessing import LabelEncoder
le = LabelEncoder()
var_to_encode = ['Device_Type','Filled_Form','Gender','Var1','Var2','Mobile_Verified','Source']
for col in var_to_encode:
    data[col] = le.fit_transform(data[col])

错误代码:

TypeError: '<' not supported between instances of 'float' and 'str'
 

evan   2018-09-30 17:06



   1个回答 
3

你看看你的那些col里有没有null或者nan的情况,如果有的话会出错

TypeError: unorderable types: float() < str()


SofaSofa数据科学社区DS面试题库 DS面经

东布东   2018-10-01 03:20

谢谢,里面确实有一个缺失值,修改后可以了 - evan   2018-10-08 10:09


  相关讨论

类别型变量如何分箱

如何检测判断特征的多重共线性?

python中如何产生交互项?

如果一列特征有90%以上的数值都是0,这个特征还有用吗?

一个特征有两个可选的值,只需满足其中一个即可,该如何处理?

怎么处理训练集中有而测试集中没有的那些特征?

wrapper特征选择法是什么意思?

对于组合特征怎么理解?

什么情况下需要做特征选择?

使用lightgbm,训练前对数据特征赋予权重是否对结果有影响

  随便看看

kNN算法有哪些缺点?

单一变量下的异常检测该怎么做?

推荐系统里的ALS是什么意思?

python产生服从常用概率分布的随机数

pandas报错ValueError: Cannot convert non-finite values (NA or inf) to integer