摘要: 8、Hadoop输入输出格式 除了 Spark 封装的格式之外,也可以与任何 Hadoop 支持的格式交互。Spark 支持新旧两套Hadoop 文件 API,提供了很大的灵活性。 要使用新版的 Hadoop API 读入一个文件,需要告诉 Spark 一些东西。 newAPIHadoopFile接 阅读全文
posted @ 2019-04-15 18:29 |旧市拾荒| 阅读(919) 评论(0) 推荐(0) 编辑
摘要: 一、动机 我们已经学了很多在 Spark 中对已分发的数据执行的操作。到目前为止,所展示的示例都是从本地集合或者普通文件中进行数据读取和保存的。但有时候,数据量可能大到无法放在一台机器中,这时就需要探索别的数据读取和保存的方法了。 Spark 及其生态系统提供了很多可选方案。本章会介绍以下三类常见的 阅读全文
posted @ 2019-04-15 18:24 |旧市拾荒| 阅读(3164) 评论(0) 推荐(0) 编辑