怎么对pyspark dataframe更改列名

  统计/机器学习 Python    浏览次数:14407        分享
0

怎么对pyspark dataframe更改列名?


我不是问的pandas dataframe,是pyspark.sql.dataframe.DataFrame。

(pandas更改列名的方法在这里。)

 

thatdeep   2018-06-16 05:19



   2个回答 
5

kidd23的方法比较麻烦,直接用withColumnRenamed就行了

new_df = df.withColumnRenamed('old_name', 'new_name')
SofaSofa数据科学社区DS面试题库 DS面经

mrhust   2019-02-19 12:03

-1

假如你要把df中一个叫old_col的列改成new_col,可以用以下的代码,其他列则不改变

import pyspark.sql.functions as F
new_df = (df
          .select(*[F.col(s).alias(new_col) if s == old_col else s for s in df.columns]))


SofaSofa数据科学社区DS面试题库 DS面经

kidd23   2018-06-21 08:37



  相关讨论

pyspark里如何进行SELECT DISTINCT操作?

得到一个pyspark.sql.dataframe中所有列的名称

如何对pyspark dataframe删除一列

返回pyspark dataframe的行数?

pyspark里unpersist()什么作用?

怎么对pyspark.sql.dataframe按照某一列降序排列?

pyspark中怎么对dataframe里的行按照列去重?

如何获取pyspark DataFrame的行数和列数?

怎么将两个pyspark dataframe以串联的形式合并?

pyspark dataframe的collect()方法是什么意思?

  随便看看

为什么样本方差是除以n-1

'numpy.ndarray' object has no attribute 'head'

回归中自变量和因变量的相关系数和回归系数(斜率)有什么关系?

Data Application Lab怎么样?

pandas读取csv中指定的某些列