摘要: 这些都是视频中的课件,安装步骤来的,没有发现问题,老师讲的比较一般 一、安装Server服务 yum install -y oracle-j2sdk1.8-1.8.0+update181-1.x86_64 yum install -y enterprise-debuginfo-6.2.1-14260 阅读全文
posted @ 2020-07-20 22:11 天宇轩-王 阅读(323) 评论(0) 推荐(0) 编辑
摘要: 下载包: https://archive.cloudera.com/cdh6/6.2.1/parcels/ https://archive.cloudera.com/cm6/6.2.1/redhat7/yum/RPMS/x86_64/ 安装依赖包 yum install -y cyrus-sasl- 阅读全文
posted @ 2020-07-20 22:03 天宇轩-王 阅读(521) 评论(0) 推荐(0) 编辑
摘要: 我个人做实验分配了5台虚拟机,每台20G内存,150G存储,应该可以玩会了。 业务集群规划 ​ 一般而言,一个集群上很少只跑一个业务,大多数情况都是多个业务共享集群,实际上就是共享系统软硬件资源。这里通常涉及两大问题,其一是业务之间资源隔离问题,就是将各个业务在逻辑上隔离开来,互相不受影响,这个问题 阅读全文
posted @ 2020-07-20 13:40 天宇轩-王 阅读(371) 评论(0) 推荐(0) 编辑
摘要: ClouderaManager的产生背景和应用场景 Apache版本的大数据组件 优点 完全开源,更新速度很快 大数据组件在部署过程中可以深刻了解其底层原理 可以了解各个组件的依赖关系 缺点 部署过程极其复杂,超过20个节点的时候,手动部署已经超级累 各个组件部署完成后,各个为政,没有统一化管理界面 阅读全文
posted @ 2020-07-20 13:38 天宇轩-王 阅读(850) 评论(0) 推荐(0) 编辑
摘要: 大数据架构和技术选型 大数据架构 源数据层: 1、sdk日志埋点 2、日志文件:爬虫日志、业务日志 3、关系型数据库:mysql、oracle等 数据采集层: 1、离线:flume、Sqoop、Nifi 2、实时:filebeat、nginx+lua 补充:当数据量达到5亿左右的时候,filebea 阅读全文
posted @ 2020-07-20 13:33 天宇轩-王 阅读(604) 评论(0) 推荐(0) 编辑