大数据导论--Linux基础
大数据导论
企业大数据分析方向
数据是什么
数据是指对客观事件进行记录并可以鉴别的符号,是对客观事物的性质、状态以及相互关系等进行记载的物理符号
或这些物理符号的组合,它是可识别的、抽象的符号。
数据分析
把隐藏在数据背后的信息集中和提炼出来,总结出所研究对象的内在规律,帮助管理者进行有效的判断和决策。
企业数据分析方向
- 现状分析--实时分析(分析当下的数据):现阶段的整体情况,各个部分的构成占比、发展、变动;
- 原因分析--离线分析(分析过去的数据):某一现状为什么发生,确定原因,做出调整优化;
- 预测分析--机器学习(结合数据预测未来):结合已有数据预测未来发展趋势。
数据分析(报告)基本步骤
数据分析步骤(流程)的重要性体现在:对如何开展数据分析提供了强有力的逻辑支撑;
基本步骤:
- 明确分析目的和思路
- 数据收集
- 数据处理
- 数据分析
- 数据展现
- 报告撰写
分布式与集群
概念
分布式:多台机器 每台机器上部署 不同组件
集群: 多台机器 每台机器上部署 相同组件
Linux操作系统概述
Linux发行版本
- Linux发行版就是由Linux内核与各种常用软件的集合产品,如今全球大约有数百款的Linux发行版本。
- 从大的方面来说,Linux发行版可大致分为 个人桌面版 和 企业服务器版。
- 个人桌面版中,Ubuntu成熟度颇高较受欢迎,而Redhat(红帽系列)及其延伸版本(Centos)凭借稳定的性能
在企业服务器中占比很大。
VMware虚拟机使用
VMware Workstation是一款虚拟机软件,允许用户将Linux、Windows等多个操作系统作为虚拟机在单台PC上运行
Centos操作系统的虚拟机导入
在没有中文、没有空格的目录下
- step1:配置VMware虚拟机网段
- step2:配置windows本地虚拟网卡
- step3:解压虚拟机压缩包
- step4:导入node1虚拟机(注意点击移动该虚拟机)
- step5:导入node2虚拟机
- step6:导入node3虚拟机
虚拟机信息
主机名 | node1.itcast.cn | node2.itcast.cn | node3.itcast.cn |
---|---|---|---|
IP | 192.168.88.151 | 198.168.88.152 | 192.168.88.153 |
用户名、密码 | root/123456 | root/123456 | root/123456 |
虚拟机命令
poweroff 关机并切断电源
poweroff -p:关机并关闭电源