最近使用xgb训练了一个多分类模型,预测 一个四分类任务,但发现预测结果的分布与真实标签的分布有很大的差异,并且无论怎么调参,预测结果的分布始终没什么变化,并且预测准确率只有0.35左右。所以我的问题是
1)为什么预测结果的分布与真实标签分布差异这么大?可能的因素是什么?该怎么解决?
2)突发奇想,可不可以用聚类算法来解决分类任务?虽然聚类算法基本都是无监督、半监督的,
最近使用xgb训练了一个多分类模型,预测 一个四分类任务,但发现预测结果的分布与真实标签的分布有很大的差异,并且无论怎么调参,预测结果的分布始终没什么变化,并且预测准确率只有0.35左右。所以我的问题是
1)为什么预测结果的分布与真实标签分布差异这么大?可能的因素是什么?该怎么解决?
2)突发奇想,可不可以用聚类算法来解决分类任务?虽然聚类算法基本都是无监督、半监督的,