图像识别和深度学习中的“组合爆炸”是什么意思?
求指教!
1个回答
和grid search调参里的组合爆炸基本上是一个意思。比如有5个超参要调,每个超参有10个候选值,组合起来的话就有$10^5=100000$个可能性要尝试。
在图像识别里也差不多,比如要识别图像里的一类物品,它可能颜色不同,材质不同,不同拍照的角度看到的形状不同,不同光照效果下的样子也不同,另外还有出现遮挡的情况,考虑到种种情况,组合在一起,每类物品就需要指数级别的训练集。图像识别一般是多分类的。对数据量的要求就非常非常大了。
这个例子是当猴子被不同物体遮挡时,预测结果都不佳。左图是猴子被判断为人;中图是猴子被判断为人,单车被判断成鸟;右图也是类似的。
这是因为训练集中并没有出现猴子与这些物体同时出现的图像,造成模型准确度下降。但是我们也无法做到把这些所有可能的组合的图像都放入训练集,组合爆炸的结果就是数据集需求量暴增。
SofaSofa数据科学社区DS面试题库 DS面经
明白了,谢谢!
-
烙神经
2019-03-16 14:44