sklearn算法里输入的数据集是要求pandas.DataFrame还是numpy.array呢

  统计/机器学习 Python    浏览次数:5497        分享
0

sklearn算法里输入的数据集的格式是要求pandas.DataFrame还是numpy.array呢?

还是都可以?


 

Pokemon   2018-03-17 21:22



   2个回答 
4

两者都可以。

但要注意,输入sklearn 的必须是数值型数据


SofaSofa数据科学社区DS面试题库 DS面经

npwong   2018-03-18 09:44

1

一般来说把df格式的转换成矩阵储存形式比较好,这样就能和np的计算函数一起用了,同时的np的array形式可以赋值到dataframe

SofaSofa数据科学社区DS面试题库 DS面经

陈十一   2018-03-19 09:09



  相关讨论

怎么把sklearn里的iris dataset转为pandas.Dataframe的形式?

删除numpy array中指定的一列

numpy里的np.newaxis有什么用?

怎么用numpy生成一个三维的tensor?

如何在numpy array尾部增加一行

numpy.full这个函数有什么用?

numpy里tile函数是怎么用的?

怎么随机打乱一个numpy array?

python里sparse matrix怎么转成正常的numpy array显示出来?

用np.round的时候报错AttributeError: no attribute 'rint'

  随便看看

神经网络中的dense和sparse是什么意思?

随机森林(random forest)和支持向量机(SVM)各有什么优劣

sklearn分类模型中预测结果怎么调整概率的阈值

线性可分是什么意思?

python里的<<或者>>符号是什么意思?