选择

投影一组表达式并返回新的 DataFrame。

Syntax

select(*cols: "ColumnOrName")

参数

参数 类型 说明
cols str、Column 或 list 列名(字符串)或表达式(列)。 如果其中一个列名称为“*”,则展开该列以包括当前 DataFrame 中的所有列。

退货

DataFrame:包含列子集(或全部)的数据帧。

示例

df = spark.createDataFrame([
    (2, "Alice"), (5, "Bob")], schema=["age", "name"])

df.select('*').show()
# +---+-----+
# |age| name|
# +---+-----+
# |  2|Alice|
# |  5|  Bob|
# +---+-----+

df.select(df.name, (df.age + 10).alias('age')).show()
# +-----+---+
# | name|age|
# +-----+---+
# |Alice| 12|
# |  Bob| 15|
# +-----+---+