对一个训练数据X=(x_1 x_2 x_3, ..., x_n)T进行Z-score规范化(零均值标准化)操作时,是令X中的每一元素
x_i=(x_i-μ)/σ ,
其中μ是x_1~x_n的均值,σ是标准差。
但是当我们进行拟合操作时,每一个X对应一个y,全部的输出y组合成为向量Y=(y_1,y_2,...,y_m)T,此时面对一个待拟合的数据集合,怎么进行Z-score操作呢?
是将每一个输入向量X分别进行Z-score操作然后Y单独也进行Z-score操作么?
还是将每一个y放入每一个X中,这样就有m个扩充的向量,然后分别对这m个向量进行Z-score操作,最后再把其中操作之后的y拎出组合成新的Y?
2个回答
我的理解是,不是对每一个输入向量标准化,而是对每一个特征进行标准化
SofaSofa数据科学社区DS面试题库 DS面经
多谢多谢,是的,提问的时候没弄懂,应该是对特征进行标准化
-
CE_PAUL
2019-02-20 11:28