以 Pandas pandas.DataFrame形式返回此数据帧的内容。
Syntax
toPandas()
退货
pandas.DataFrame
备注
仅当生成的 Pandas pandas.DataFrame 预期较小时,才应使用此方法,因为所有数据都加载到驱动程序的内存中。
用法是实验性的 spark.sql.execution.arrow.pyspark.enabled=True 。
仅当 Pandas 已安装且可用时,此选项才可用。
示例
df = spark.createDataFrame([(2, "Alice"), (5, "Bob")], schema=["age", "name"])
df.toPandas()
# age name
# 0 2 Alice
# 1 5 Bob