pandas_api

将现有数据帧转换为 pandas-on-Spark 数据帧。

Syntax

pandas_api(index_col: Optional[Union[str, List[str]]] = None)

参数

参数 类型 说明
index_col str 或 str 列表,可选 Spark 中表的索引列。

退货

PandasOnSparkDataFrame

备注

如果将 pandas-on-Spark 数据帧转换为 Spark 数据帧,然后返回到 pandas-on-Spark,它将丢失索引信息,原始索引将转换为普通列。

仅当 Pandas 已安装且可用时,此选项才可用。

示例

df = spark.createDataFrame(
    [(14, "Tom"), (23, "Alice"), (16, "Bob")], ["age", "name"])

df.pandas_api()
#    age   name
# 0   14    Tom
# 1   23  Alice
# 2   16    Bob

df.pandas_api(index_col="age")
#       name
# age
# 14     Tom
# 23   Alice
# 16     Bob