一开始数据集要被分成三份,分别是训练集、验证集、测试集。验证集和测试集都需要吗?是不是重复了?只留其中一个可以吗?
2个回答
验证集(validation set)和测试集(test set)本身就并不是完全等价的。
参考:validation set和test set的区别?
在这两个集合上可以分别得到验证误差和测试误差,用来衡量模型表现精度。
有时候我们用cross valiadtion来代替training set和validation set,但是即便如此,我们也最好要留一份test set。
SofaSofa数据科学社区DS面试题库 DS面经