我现在要做一个聚类,问题是维数特别大,因为有很多数值变量(200多个),还有很多分类变量(40多个),如果再对分类变量做独热处理的话,特征的个数就好几千了。这种高维数据应该用什么聚类模型?
K Means、阶层聚类或者GMM明显都不大合适。大家有这方面的经验吗?谢谢!
我现在要做一个聚类,问题是维数特别大,因为有很多数值变量(200多个),还有很多分类变量(40多个),如果再对分类变量做独热处理的话,特征的个数就好几千了。这种高维数据应该用什么聚类模型?
K Means、阶层聚类或者GMM明显都不大合适。大家有这方面的经验吗?谢谢!