摘要: 官方文档介绍地址: https://access.redhat.com/documentation/en-US/Red_Hat_Enterprise_Linux/7/html/Security_Guide/sec-Using_Firewalls.html#sec-Introduction_to_fi 阅读全文
posted @ 2019-10-29 21:25 酒剑仙* 阅读(395) 评论(0) 推荐(1) 编辑
摘要: 1:下载安装包 wget http://dev.mysql.com/get/Downloads/MySQL-5.6/mysql-5.6.33-linux-glibc2.5-x86_64.tar.gz 2:解压 # 解压tar -zxvf mysql-5.6.33-linux-glibc2.5-x86 阅读全文
posted @ 2019-10-29 19:49 酒剑仙* 阅读(283) 评论(0) 推荐(0) 编辑
摘要: 一、需求分析 1.1. 背景介绍 在线社交平台每天都会有大量的用户在线,会出现大量的聊天数据,通过对聊天数据的统计分析,可以更好的对用户构建精准的用户画像,为用户提供更好的服务以及实现高 ROI 的平台运营推广,给公司的发展决策提供精确的数据支撑。后续将基于一个社交平台 App 的用户数据,完成相关 阅读全文
posted @ 2019-10-29 12:30 酒剑仙* 阅读(1297) 评论(0) 推荐(0) 编辑
摘要: 一、Hive函数 1.1.函数分类 Hive的函数分为两大类:内置函数、用户定义函数UDF Hive 的函数共计有上百种,下面会挑选一些常用的进行讲解。 详细的函数使用可以参阅官方文档 (https://cwiki.apache.org/confluence/display/Hive/Languag 阅读全文
posted @ 2019-10-29 12:09 酒剑仙* 阅读(944) 评论(0) 推荐(0) 编辑
摘要: 一、基本查询 1.1.基本语法 查询语句的基本语法: SELECT [ALL | DISTINCT]select_expr, select_expr, ... FROM table_reference [WHERE where_condition] [GROUP BYcol_list] [HAVIN 阅读全文
posted @ 2019-10-29 11:48 酒剑仙* 阅读(4833) 评论(0) 推荐(0) 编辑
摘要: 一、数据库操作 1.1.数据库操作语法 基于语法描述说明 CREATE DATABASE [IF NOT EXISTS] db_name [LOCATION] 'path'; SELECT expr, ... FROM tbl ORDER BY col_name [ASC | DESC] (A | 阅读全文
posted @ 2019-10-29 11:40 酒剑仙* 阅读(1324) 评论(0) 推荐(0) 编辑
摘要: 一、Apache Hive 概述 1.1.什么是分布式SQL计算 对数据进行统计分析, SQL 是目前最为方便的编程工具。大数据体系中充斥着非常多的统计分析场景,所以使用 SQL 去处理数据,在大数据中也是有极大的需求的。 MapReduce 支持程序开发( Java 、 Python等)但不支持 阅读全文
posted @ 2019-10-29 11:16 酒剑仙* 阅读(1337) 评论(0) 推荐(0) 编辑
摘要: 一、分布式计算概述 1.1.什么是计算 计算是对数据进行处理,使用统计分析等手段得到需要的结果,大数据体系内的计算, 举例: 销售额统计、区域销售占比、季度销售占比 利润率走势、客单价走势、成本走势 品类分析、消费者分析、店铺分析 等等一系列,基于数据得出的结论。 这些就是我们所说的计算。 1.2. 阅读全文
posted @ 2019-10-29 09:43 酒剑仙* 阅读(599) 评论(0) 推荐(0) 编辑