比如有一列日期,是yyyy-mm-dd格式的字符,我想把它转成第几星期,比如2020-01-13就是第3周。
想要的效果是:
2020-01-13 ===== 3
2020-01-15 ===== 3
2020-01-29 ===== 5
2020-02-07 ===== 6
2个回答
pyspark的函数里有date_format,可以让日期变为week of year
from pyspark.sql import functions as F
把日期dt这列变成第几周的代码是
F.date_format(F.col('dt'), 'w')
然后得到的数就是表示是该年度中的第几周
SofaSofa数据科学社区DS面试题库 DS面经df2 = pd.DataFrame({'date':['2020-01-21 10:20:23', '2020-01-22 11:20:23', '2020-02-21 10:50:33']})
df2['date3']=pd.to_datetime(df2.date).dt.weekofyear
SofaSofa数据科学社区DS面试题库 DS面经
你这个是pandas,题目里应该问的是pyspark
-
baozi
2020-03-29 20:17