大数据知识梳理
最近在做项目的时候,遇到了与大数据相关的知识。在与研发交流的过程中,感觉到自己的知识储备有限,无法正常的交流,所以周末在家里学习了下,最近涉及到的一些数据库工具,同时发散的学习了相关的知识。
在项目中最先遇到的是kudu和impala,但是之前遇到的数据库都是关系型的数据库(Oracle、Mysql、SQL Server或者redis之类),没有遇到过大数据相关的数据库,所有交流起来有些懵。基于kudu自己扩散性的学习到了如下的一些知识。
学习的目的主要是了解这些大数据工具和数据库有的基本作用和区别,如下是只是架构图:
相关链接:
02. https://www.runoob.com/docker/docker-tutorial.html
05. https://www.ctl.io/developers/blog/post/what-is-rocket-and-how-its-different-than-docker/
06. https://hadoop.apache.org/
07. https://www.runoob.com/w3cnote/hadoop-tutorial.html
08. https://kudu.apache.org/docs/
11. https://impala.apache.org/
12. https://spark.apache.org/docs/latest/
13. https://flink.apache.org/flink-architecture.html