以 PyArrow pyarrow.Table形式返回此数据帧的内容。
在 Databricks Runtime 15.3 中添加
Syntax
toArrow()
退货
pyarrow.Table
备注
仅当生成的 PyArrow pyarrow.Table 应较小时,才应使用此方法,因为所有数据都加载到驱动程序的内存中。
仅当 PyArrow 已安装且可用时,才可用。
此 API 是开发人员 API。
示例
df = spark.createDataFrame([(2, "Alice"), (5, "Bob")], schema=["age", "name"])
df.coalesce(1).toArrow()
# pyarrow.Table
# age: int64
# name: string
# ----
# age: [[2,5]]
# name: [["Alice","Bob"]]