1,以下是用分别用逻辑回归与神经网络得出的学习曲线,通过sklearn learning_curve 方法获取并画出的图。这个图有点奇怪,为什么train dataset和cv dataset都是一个方向并且比较一致的?请高手帮忙分析一下,如下图:
2,这两个模型通过测试数据得出的相关评价指标都比较高的,如下:
1个回答
你的train_size是什么意思?
在训练刚开始的时候方向一致是很正常的,根据你的图里来看,两个模型可能都还在欠拟合的阶段,所以training accuracy和cv accuracy都是在上升。一般来说t随着训练次数增加,模型会从欠拟合状态变为过拟合的状态,这个过程中train的accuracy会持续上升,而cv的accuracy会在某个点之后开始下降,开始下降的这个点就是这个模型的最优状态。
SofaSofa数据科学社区DS面试题库 DS面经