快取

保留默认存储级别的 DataFrame(MEMORY_AND_DISK_DESER)。

Syntax

cache()

退货

DataFrame:缓存的数据帧。

备注

默认存储级别已更改为 MEMORY_AND_DISK_DESER 匹配 3.0 中的 Scala。

缓存的数据在群集上的所有 Spark 会话之间共享。

示例

df = spark.range(1)
df.cache()
# DataFrame[id: bigint]

df.explain()
# == Physical Plan ==
# InMemoryTableScan ...