保留默认存储级别的 DataFrame(MEMORY_AND_DISK_DESER)。
Syntax
cache()
退货
DataFrame:缓存的数据帧。
备注
默认存储级别已更改为 MEMORY_AND_DISK_DESER 匹配 3.0 中的 Scala。
缓存的数据在群集上的所有 Spark 会话之间共享。
示例
df = spark.range(1)
df.cache()
# DataFrame[id: bigint]
df.explain()
# == Physical Plan ==
# InMemoryTableScan ...