大数据导论--Linux基础

大数据导论

企业大数据分析方向

数据是什么

数据是指对客观事件进行记录并可以鉴别的符号,是对客观事物的性质、状态以及相互关系等进行记载的物理符号
或这些物理符号的组合,它是可识别的、抽象的符号。

数据分析

把隐藏在数据背后的信息集中和提炼出来,总结出所研究对象的内在规律,帮助管理者进行有效的判断和决策。

企业数据分析方向

  • 现状分析--实时分析(分析当下的数据):现阶段的整体情况,各个部分的构成占比、发展、变动;
  • 原因分析--离线分析(分析过去的数据):某一现状为什么发生,确定原因,做出调整优化;
  • 预测分析--机器学习(结合数据预测未来):结合已有数据预测未来发展趋势。

数据分析(报告)基本步骤

数据分析步骤(流程)的重要性体现在:对如何开展数据分析提供了强有力的逻辑支撑;

基本步骤:

  • 明确分析目的和思路
  • 数据收集
  • 数据处理
  • 数据分析
  • 数据展现
  • 报告撰写

分布式与集群

概念

分布式:多台机器 每台机器上部署 不同组件
集群: 多台机器 每台机器上部署 相同组件

Linux操作系统概述

Linux发行版本

  • Linux发行版就是由Linux内核与各种常用软件的集合产品,如今全球大约有数百款的Linux发行版本。
  • 从大的方面来说,Linux发行版可大致分为 个人桌面版 和 企业服务器版。
  • 个人桌面版中,Ubuntu成熟度颇高较受欢迎,而Redhat(红帽系列)及其延伸版本(Centos)凭借稳定的性能
    在企业服务器中占比很大。

VMware虚拟机使用

VMware Workstation是一款虚拟机软件,允许用户将Linux、Windows等多个操作系统作为虚拟机在单台PC上运行

Centos操作系统的虚拟机导入

在没有中文、没有空格的目录下

  • step1:配置VMware虚拟机网段
  • step2:配置windows本地虚拟网卡
  • step3:解压虚拟机压缩包
  • step4:导入node1虚拟机(注意点击移动该虚拟机)
  • step5:导入node2虚拟机
  • step6:导入node3虚拟机
    虚拟机信息
主机名 node1.itcast.cn node2.itcast.cn node3.itcast.cn
IP 192.168.88.151 198.168.88.152 192.168.88.153
用户名、密码 root/123456 root/123456 root/123456

虚拟机命令

poweroff 关机并切断电源
poweroff -p:关机并关闭电源

posted @ 2022-06-01 17:06  半个程序猿Cohen_Lee  阅读(65)  评论(0编辑  收藏  举报