我有一个关于python编程的问题。用pandas我们可以进行groupby和agg的操作,比如
>>> df.groupby('my_col').agg(['mean', 'max'])
我们可以求每组的mean和max。如果我现在要在每组上用我的自定义的函数,该如何调用?
1个回答
先写出自己定义的函数f,比如说我们要知道最大值和中位数的差
def my_func(x):
res = max(x) - np.median(x)
return res
df.groupby('my_col').agg([my_func])
如果有多个自定义的函数的话
df.groupby('loc_id').agg([my_func1, my_func2, my_func3])
感谢!正在找这个功能呢!
-
何立诚
2019-08-22 00:18