比如說有一個binary的特征表示性別,可以将其二值化成0及1,或one hot为向量[0, 1]及[1, 0],分別表示成男及女。 哪一个较好或更常用?
1个回答
肯定是直接将男女表示为0或1更好啊
因为性别本身就是binary的,所以没必要进行one-hot。one-hot之后的数据是有冗余的,因为你可以根据[0,1]推出[1,0]。
SofaSofa数据科学社区DS面试题库 DS面经比如說有一個binary的特征表示性別,可以将其二值化成0及1,或one hot为向量[0, 1]及[1, 0],分別表示成男及女。 哪一个较好或更常用?
肯定是直接将男女表示为0或1更好啊
因为性别本身就是binary的,所以没必要进行one-hot。one-hot之后的数据是有冗余的,因为你可以根据[0,1]推出[1,0]。
SofaSofa数据科学社区DS面试题库 DS面经