大数据学习路线

目录

目录


link

第一节:为什么要学习大数据
1、目的:很好工作
2、对比:Java开发和大数据开发

第二节:什么是大数据?
举例:

  • 1、商品推荐
    问题:
    (1)大量的订单如何存储?
    (2)大量的订单如何计算?
  • 2、天气预报
    问题:
    (1)大量的天气数据如何存储?
    (2)大量的天气数据如何计算?

什么是大数据,本质?
(1)数据的存储:分布式文件系统(分布式存储)
(2)数据的计算:分布式计算

第三节:Java和大数据是什么关系?
1、 Hadoop:基于Java语言开发
2、 Spark:基于 Scala语言,Sca1a基于Java语言

第四节:学习大数据需要的基础和路线

1、学习大数据需要的基础:
Java基础( Javase)---> 类、继承、I/0、反射、泛型
Linux基础( Linux l的操作)---> 创連文件、目录、vi辑器

2、学习路线

  • (1)Java基础和 linux基础
  • (2) Hadoop 的学习:体系结构、原理、编程
    • 第一阶段:HDFS(分布式文件系统)、 MapReduce(大数据计算程序)、 Hbase( NOSQL数据库)
    • 第二阶段:
      • 数据分析引警
      • 数据采集引--> Scoop、 Flume
    • 第三阶段:
      • HUE:Web管理工具
      • ZooKeeper:实现 Hadoop的HA
      • Oozie: 工作流引聱
  • (3) Spark的学习
    • 第一个阶段:Sca1a编程语言*)
    • 第二个阶段: Spark Core -----> 基于内存,数据的计算
    • 第三个阶段: Spark SQL 类似oracle中的sqL语句

https://mp.weixin.qq.com/s/GWEhQOCPBAMTofu5YQgx5w

posted @ 2020-09-02 09:24  Janey91  阅读(112)  评论(0编辑  收藏  举报