吐槽一下python里的SHAP,实在太慢了,三十万左右的数据量一百个特征,基本上跑不出来。有什么替代方案吗?
您确定要删除本贴么?所有相关回复也会被一并删除并且无法恢复。
TheTheThe 2020-03-02 22:51
Github上有一个讨论,供参考
How to speed up SHAP computation
strong.man 2020-07-23 20:43
回答问题时需要注意什么?
我们谢绝在回答前讲“生动”的故事。 我们谢绝答非所问。 我们谢绝自己不会、硬要回答。我们谢绝“这么简单,自己想”、“书上有,自己找”这类回答;如果你认为对方提问方式或者内容不妥,可以直接忽略,不作解答,甚至投反对票。我们感激每一个用户在编写答案时的努力与付出!
相关讨论
关于shap.summary_plot显示特征个数的疑问
一个特征有两个可选的值,只需满足其中一个即可,该如何处理?
获取seaborn color_palette里每个颜色的rgb数值?
plt.subplot怎么设置才能每行图的个数不一样?
用matplotlib.pyplot作图时,调整标题中文字的大小
画图的时候RuntimeError: Invalid DISPLAY variable
plt.subplots作图效果很奇怪,出问题
matplotlib.pyplot画图怎么添加横轴,纵轴的名字?
plt.plot作图,隐藏坐标轴
plt.scatter出现AttributeError: Unknown property markersize
随便看看
numpy里的无穷大np.inf到底是多大呢?
pip install opencv-python失败,难道非要编译安装?
dataframe每行或者每列中缺失值(na, nan, null)的个数
如果样本不是正态分布,还能用t-test或者z-test吗?
ARIMA模型中的三个参数(p, d, q)都是什么意思?