平常我们对数值特征做标准化都是:(数值 - 均值)/标准差
这样标准化处理后的特征有正值也会有负值。
有没有一种标准化的方法能够让处理后的数值都是正数,或者非负数?
3个回答
题主可以看下在数据预处理阶段,特征的标准化有哪些方法?
“最大最小值标准化”可以在训练集上保证处理后的数值为非负。
“范数标准化”可以在训练集上保证处理后的数值为[-1, 1],再加1,就可以保证非负。
当然还有非线性的标准化,比如百分位标准化,最后得到是[0, 100]范围的数。
不过这几个方法都不能确保在测试集上的处理结果也是非负的。如果你的模型或者方程必须要输入值为非负的,那么你需要在测试集上多做一点处理,比如说所有负数都取0等等。
SofaSofa数据科学社区DS面试题库 DS面经
谢谢提供的链接
-
chang
2019-02-28 23:28