比如我的pyspark sql dataframe里有一列日期
dates
2020-01-20
2020-01-25
2020-02-01
2020-02-29
我想返回的是加工后的一列,这一列对应着每一行中dates日期所在的月的最后一天。比如上面的结果应该是
last_day_a_month
2020-01-31
2020-01-31
2020-02-29
2020-02-29
在pyspark里我该怎么操作?
1个回答
先引用一下pyspark的functions
import pyspark.sql.functions as F
然后用Functions中的last_day函数就可以得到当月的最后一天
select(F.last_day(F.col('dates')).alias('last_day_of_month'))