摘要: import java.io.IOException; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.fs.Path; import org.apache.hadoop.io.LongWritable; import org.apache.hadoop.io.Text; import org.apac... 阅读全文
posted @ 2018-11-17 20:32 Z、某某 阅读(477) 评论(0) 推荐(0) 编辑
摘要: SparkStreaming的Receiver方式和直连方式有什么区别? Receiver接收固定时间间隔的数据(放在内存中的),使用高级API,自动维护偏移量,达到固定的时间才去进行处理,效率低并且容易丢失数据,灵活性特别差,不好,而且它处理数据的时候,如果某一刻的数据量过大,那么就会造成磁盘溢写 阅读全文
posted @ 2018-11-17 20:12 Z、某某 阅读(1390) 评论(0) 推荐(0) 编辑
摘要: 当我们生产者生产json 文件的时候 消费时用JSON读文件时,如下: Job aborted due to stage failure: Task 1 in stage 0.0 failed 1 times, most recent failure: Lost task 1.0 in stage  阅读全文
posted @ 2018-11-17 16:16 Z、某某 阅读(1558) 评论(0) 推荐(0) 编辑