spark RDD中的cache和persist -- (视频笔记)


cache只是persist中的一种情况。
cache由persist实现
SotrageLevel 缓存级别,是一个枚举。
从磁盘缓存到内存中
cache算子对RDD转换

persist(MEMORY_AND_DISK) lazy级别
从磁盘获取数据,如果内存不够则缓存到磁盘中。

unpersist (立即生效)
mark the rdd as non-persistent, and remove all blocks from it from mamory and disk

posted @ 2015-12-29 14:13  逸新  阅读(543)  评论(0编辑  收藏  举报