sklearn算法里输入的数据集的格式是要求pandas.DataFrame还是numpy.array呢?
还是都可以?
您确定要删除本贴么?所有相关回复也会被一并删除并且无法恢复。
Pokemon 2018-03-17 21:22
两者都可以。
但要注意,输入sklearn 的必须是数值型数据
npwong 2018-03-18 09:44
一般来说把df格式的转换成矩阵储存形式比较好,这样就能和np的计算函数一起用了,同时的np的array形式可以赋值到dataframe
陈十一 2018-03-19 09:09
回答问题时需要注意什么?
我们谢绝在回答前讲“生动”的故事。 我们谢绝答非所问。 我们谢绝自己不会、硬要回答。我们谢绝“这么简单,自己想”、“书上有,自己找”这类回答;如果你认为对方提问方式或者内容不妥,可以直接忽略,不作解答,甚至投反对票。我们感激每一个用户在编写答案时的努力与付出!
相关讨论
怎么把sklearn里的iris dataset转为pandas.Dataframe的形式?
删除numpy array中指定的一列
numpy里的np.newaxis有什么用?
怎么用numpy生成一个三维的tensor?
如何在numpy array尾部增加一行
numpy.full这个函数有什么用?
numpy里tile函数是怎么用的?
怎么随机打乱一个numpy array?
python里sparse matrix怎么转成正常的numpy array显示出来?
用np.round的时候报错AttributeError: no attribute 'rint'
随便看看
神经网络中的dense和sparse是什么意思?
随机森林(random forest)和支持向量机(SVM)各有什么优劣
sklearn分类模型中预测结果怎么调整概率的阈值
线性可分是什么意思?
python里的<<或者>>符号是什么意思?