摘要: 1. Spark SQL定位处理结构化数据的模块。SparkSQL提供相应的优化机制,并支持不同语言的开发API。 java、scala、Python,类SQL的方法调用(DSL) 2. RDD与Spark SQL的比较说明: 使用Spark SQL的优势:a.面向结构化数据;b.优化机制; RDD 阅读全文
posted @ 2018-12-31 15:51 Coding_Now 阅读(757) 评论(0) 推荐(0) 编辑
摘要: 步骤: 1.在Linux下安装netcat工具,用户开启socket客户端: a.切换至root下 $>su root b.执行安装命令 $>yum install -y nc c.切换至Alex_lei用户下,模拟聊天室: $>nc 开启服务端 $>nc -l 55555 开启客户端 $>nc l 阅读全文
posted @ 2018-12-31 13:38 Coding_Now 阅读(1003) 评论(0) 推荐(0) 编辑
摘要: 一:介绍 (1)日志采集系统 (2)是一种分布式,可靠且可用的服务,用于有效地收集,聚合和移动大量日志数据。 (3)具有基于流数据流的简单灵活的架构。 (4)具有可靠的可靠性机制和许多故障转移和恢复机制,具有强大的容错能力。 二:flume的三个组件:【Source,Channel,Sink】构成A 阅读全文
posted @ 2018-12-31 13:14 Coding_Now 阅读(186) 评论(0) 推荐(0) 编辑