RT.请问:
在SVM中,有没有一种理论可以指导我们为了训练得到一个较好的分类机/回归机,需要给多少个训练点,这个训练点的个数与哪些量有关呢?
1个回答
有个One_in_ten_rule,意思是1个可变参数需要10个数据。也有"1 in 20"和"1 in 50"。这和置信区间的计算有关。结论是一个参数要5-50个相关数据。“相关”是指这些数据在loss相对于参数的导数不能为0。对于SVM,support vectors才是用于参数估计的点。
SofaSofa数据科学社区DS面试题库 DS面经