RICH-ATONE

2020年11月19日 #

Hive表压缩

摘要: Hive数仓中建表尽量都采用压缩,采用压缩能极大的节省存储空间,减少成本消耗。 一般建表采用orc snappy压缩格式。如果load数据或者sqoop导入数据到hive中,不能直接使用压缩,可以建临时中间表,查询插入到压缩表中。总之,能节省成本就节省成本,压缩是个不错的选择。 同时也支持对表后期更 阅读全文

posted @ 2020-11-19 22:28 RICH-ATONE 阅读(1131) 评论(0) 推荐(0) 编辑

2020年11月18日 #

HIVE拉链表示例

摘要: 极限存储: 一般采用拉链表。 拉链表针对一个变化字段进行操作一个变化字段进行设计开始和结束时间。如果有多个字段进行更新变化,则需要设计多个开始和结束时间,复杂度比较高,或者进行拆表进行设计或者选择全量进行存储。 场景: 在数据仓库的数据模型设计过程中,经常会遇到下面这种表的设计: 有一些表的数据量很 阅读全文

posted @ 2020-11-18 23:13 RICH-ATONE 阅读(292) 评论(0) 推荐(1) 编辑

2020年11月16日 #

Title

摘要: 数据运营手册 阅读全文

posted @ 2020-11-16 18:39 RICH-ATONE 阅读(88) 评论(0) 推荐(0) 编辑

Hadoop的HA的搭建

摘要: 在非高可用分布的集群的基础上进行搭建: 一般使用HDFS High Availability Using the Quorum Journal Manager此方式进行搭建。 Zookeeper部署: 1.tar -zxvf zookeeper-3.4.10.tar.gz -C ./ (解压zk到当 阅读全文

posted @ 2020-11-16 00:04 RICH-ATONE 阅读(253) 评论(0) 推荐(0) 编辑

2020年11月12日 #

Make A Question

摘要: https://www.codewars.com/ 阅读全文

posted @ 2020-11-12 18:27 RICH-ATONE 阅读(137) 评论(0) 推荐(0) 编辑

2020年11月9日 #

Oozie调度hive报错application application failed 2 times due to applicationmaster for attempt appattempt_ timed out. failing the application.

摘要: <action name="xxx"> <hive xmlns="uri:oozie:hive-action:0.5"> <job-xml>${nameNode}/xxx/hive-site.xml</job-xml> <configuration> <property> <name>oozie.l 阅读全文

posted @ 2020-11-09 18:44 RICH-ATONE 阅读(1092) 评论(0) 推荐(0) 编辑

2020年11月8日 #

Oozie介绍与相关使用

摘要: oozie Oozie工作流程定义是一个DAG(Directed Acyclical Graphs)图,它由控制流节点(Control Flow Nodes)或动作节点(Action Nodes)组成 官网:http://oozie.apache.org/ 一.功能模块: Workflow 顺序执行 阅读全文

posted @ 2020-11-08 22:06 RICH-ATONE 阅读(383) 评论(0) 推荐(0) 编辑

Oozie常用命令及注意问题

摘要: Web界面: http://localhost:11000/oozie 检查配置文件是否有效: oozie validate workflow.xml 提交作业并让作业进入PREP状态: oozie job -oozie http://localhost:11000/oozie -config jo 阅读全文

posted @ 2020-11-08 22:05 RICH-ATONE 阅读(549) 评论(0) 推荐(0) 编辑

2020年11月6日 #

mysql中的utf8与utf8mb4

摘要: 示例:建表语句后设置 ENGINE=InnoDB DEFAULT CHARSET=utf8 总结来说: utf8 是mysql 挖的坑,utf8mb4才是真正的 utf8 ,一般实际生产,进行数据库迁移的时候转换成utf8mb4是比较好的 注:show create table 进行显示的时候还是显 阅读全文

posted @ 2020-11-06 10:26 RICH-ATONE 阅读(155) 评论(0) 推荐(0) 编辑

2020年11月5日 #

Flink WordCount计算详解

摘要: pom依赖准备: <?xml version="1.0" encoding="UTF-8"?> <project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instanc 阅读全文

posted @ 2020-11-05 19:11 RICH-ATONE 阅读(465) 评论(0) 推荐(0) 编辑

导航