有一个数据框 ,
每个pid对应的日期的start end 不同
如何新产生一列分组var,
使得 var从pid start到end 每7天是一组
比如 图中pid 2011-07-01 到 2011-07-07 var=1
2011-07-08 到 2011-07-14 var=2
2011-07-15 到 2011-07-21 var=3
依次类推
产生这个var之后 我可以根据groupby 进行分组处理
1个回答
你用date里的日期减去2011-07-01得到的天数,然后整除7就可以了
假如你的数据框叫做df,可以用下面的代码得到你要的var
df['var'] = (pd.to_datetime(df['date']) - pd.to_datetime('2011-07-01')).dt.days // 7
谢谢 后来我想到的也是这个方法
-
constant007
2020-03-22 13:25