第一节:分布式文件系统(DFS,Distributed File System)
2018-11-30 08:26 陈子宁 阅读(406) 评论(0) 编辑 收藏 举报1 Hadoop教程:http://hadoop.apache.org/docs/r1.0.4/cn/mapred_tutorial.html
Master 和 Slave(Code),对应 namecode 和 datacode
2. Spark教程:https://www.cnblogs.com/shishanyuan/p/4699644.html
spark 有类似SQL的功能
- 2.1 create external table:https://blog.csdn.net/u013850277/article/details/65749770?utm_source=itdadao&utm_medium=referral
3.SQL:http://www.w3school.com.cn/index.html
4.HBase KV存储(key-values存储):非关系型数据库,区别于MySQL,速度更快。
5.上传系统、数据采集工具(数据接入服务DIS)涉及到的概念:消息队列、消息通道
6. 实时流计算,Cloud Stream service,CS ,
(可用于大盘监控等),开源框架:Heron、storm、akka,kafka,apache spark,apache,apex
Flink Sql 教程:https://mp.weixin.qq.com/s/o_E4KVMAvkt41lRdeUWrEw