sameSemantics

True 两个 DataFrame 内的逻辑查询计划相等时返回,因此返回相同的结果。

Syntax

sameSemantics(other: "DataFrame")

参数

参数 类型 说明
other DataFrame 要与之进行比较的另一个数据帧。

退货

bool:这两个数据帧是否相似。

备注

此处的相等比较通过容忍外观差异(如属性名称)来简化。

此 API 可以非常快速地比较这两个数据帧,但仍可以在返回相同结果(例如来自不同计划)的数据帧上返回 False 。 以缓存为例时,这种误报语义非常有用。

此 API 是开发人员 API。

示例

df1 = spark.range(10)
df2 = spark.range(10)
df1.withColumn("col1", df1.id * 2).sameSemantics(df2.withColumn("col1", df2.id * 2))
# True
df1.withColumn("col1", df1.id * 2).sameSemantics(df2.withColumn("col1", df2.id + 2))
# False
df1.withColumn("col1", df1.id * 2).sameSemantics(df2.withColumn("col0", df2.id * 2))
# True