spark RDD中的cache和persist -- (视频笔记)
cache只是persist中的一种情况。
cache由persist实现
SotrageLevel 缓存级别,是一个枚举。
从磁盘缓存到内存中
cache算子对RDD转换
persist(MEMORY_AND_DISK) lazy级别
从磁盘获取数据,如果内存不够则缓存到磁盘中。
unpersist (立即生效)
mark the rdd as non-persistent, and remove all blocks from it from mamory and disk