pandas里pd.cut怎么用?
2个回答
官网上介绍的比较清楚了,并且在下面还有例子。
https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.cut.html?highlight=cut#pandas.cut
简单的一句话pandas的cut可以把一组数据分割成离散的区间。
import numpy as np
import pandas as pd
pd.cut(np.array([1, 7, 5, 4, 6, 3]), 3)
#output:
#[(0.994, 3.0], (5.0, 7.0], (3.0, 5.0], (3.0, 5.0], (5.0, 7.0], (0.994, 3.0]]
#返回的是每个元素所在的区间
SofaSofa数据科学社区DS面试题库 DS面经pd.cut可以方便将连续数值离散化。
下面的例子就是利用pd.cut将成绩分数转成等第。
def score2grade(score):
grade = pd.cut(score, [0, 60, 70, 80, 90, np.inf], right=False, labels=['F', 'D', 'C', 'B', 'A'])
return grade
比如
score2grade([45, 65, 70, 92])
就会得到['F', 'D', 'C', 'A']
SofaSofa数据科学社区DS面试题库 DS面经