摘要: 一. 1、对比:离线计算和实时计算 离线计算:MapReduce,批量处理(Sqoop-->HDFS--> MR > HDFS) 实时计算:Storm和Spark Sparking,数据实时性(Flume > Kafka > 流式计算 > Redis) 2、常见的实时计算(流式计算)代表 (1)Ap 阅读全文
posted @ 2018-03-27 21:08 梦里南柯 阅读(3812) 评论(0) 推荐(0) 编辑
摘要: 一、Redis内存数据库 一个key-value存储系统,支持存储的value包括string(字符串)、list(链表)、set(集合)、zset(sorted set--有序集合)和hash(哈希类型)。数据存在缓存中。 与MemCached区别: (*)支持持久化 (*)丰富的数据类型 (*) 阅读全文
posted @ 2018-03-27 17:33 梦里南柯 阅读(189) 评论(0) 推荐(0) 编辑
摘要: 一、为什么要把数据存入内存? 1、原因:快2、常见的内存数据库 (*)MemCached:看成Redis的前身,严格来说Memcached的不能叫数据库,原因:不支持持久化 (*)Redis:内存数据库,持久化(RDB、AOF) (*)Oracle TimesTen (*)SAP HANA 二、Me 阅读全文
posted @ 2018-03-27 15:59 梦里南柯 阅读(171) 评论(0) 推荐(0) 编辑
摘要: 一.Sqoop数据采集引擎 采集关系型数据库中的数据 用在离线计算的应用中 强调:批量 (1)数据交换引擎: RDBMS < > Sqoop < > HDFS、HBase、Hive (2)底层依赖MapReduce (3)依赖JDBC (4)安装:tar -zxvf sqoop-1.4.5.bin_ 阅读全文
posted @ 2018-03-27 14:29 梦里南柯 阅读(497) 评论(0) 推荐(0) 编辑