我遇到的问题是变量很多,所以想用Lasso方法,这样得到的模型会有很多变量的系数为0。
我运行了一次Lasso之后,发现还是有很多的变量的系数不为0,我能不能对剩下的变量再做一次Lasso,反复进行,直到剩下的变量比较少为止。
我想知道这样做有没有什么道理,或者说有什么问题?
1个回答
如果你觉得变量在Lasso之后仍然太多,你应该增大你的正则系数,让惩罚更大,而不是再重复一次Lasso。
其次你说“直到剩下的变量比较少为止”,这不是一个很科学的说法,变量的多少不是人为决定的,应该是通过对惩罚系数进行交叉验证调参得到的。
你可以看下Lasso path,它能够反映出惩罚系数和剩下的变量的个数。
SofaSofa数据科学社区DS面试题库 DS面经