大数据吧 关注:165,821贴子:208,445
  • 0回复贴,共1

Spark 中的 RDD 是什么?

只看楼主收藏回复

RDD(Resilient Distributed Datasets,弹性分布式数据集)是Spark中一个关键的数据结构,它代表了一个被分区的只读数据集。RDD可以缓存到内存中,因此可以在多个任务中重复使用。


IP属地:北京1楼2023-07-07 17:31回复