这个回归问题里,真实的y,大部分为0(95%以上)。有什么好的解决方案吗?
3个回答
如y是整数,可以用Zero-inflated Poisson models。
如果是实数:
1. Tobit regression
2. 先做0/非0的分类,然后做非0的回归。
3.Tweedie distributions
简单的方法就是第2个,其余两个在R有package。
SofaSofa数据科学社区DS面试题库 DS面经这个回归问题里,真实的y,大部分为0(95%以上)。有什么好的解决方案吗?
如y是整数,可以用Zero-inflated Poisson models。
如果是实数:
1. Tobit regression
2. 先做0/非0的分类,然后做非0的回归。
3.Tweedie distributions
简单的方法就是第2个,其余两个在R有package。
SofaSofa数据科学社区DS面试题库 DS面经