投影一组表达式并返回新的 DataFrame。
Syntax
select(*cols: "ColumnOrName")
参数
| 参数 | 类型 | 说明 |
|---|---|---|
cols |
str、Column 或 list | 列名(字符串)或表达式(列)。 如果其中一个列名称为“*”,则展开该列以包括当前 DataFrame 中的所有列。 |
退货
DataFrame:包含列子集(或全部)的数据帧。
示例
df = spark.createDataFrame([
(2, "Alice"), (5, "Bob")], schema=["age", "name"])
df.select('*').show()
# +---+-----+
# |age| name|
# +---+-----+
# | 2|Alice|
# | 5| Bob|
# +---+-----+
df.select(df.name, (df.age + 10).alias('age')).show()
# +-----+---+
# | name|age|
# +-----+---+
# |Alice| 12|
# | Bob| 15|
# +-----+---+