2020 年 9月 3 日随笔档案 - 苏su

2020年9月3日

摘要：创建作业及运行 1）ORACLE 到 ODPS 任务例：从 ORACLE 读取数据到 ODPS $ cd {YOUR_DATAX_HOME}/job $ vi ora_odps.json { "job": { "setting": { "speed": { "channel": "5" } }, 阅读全文

posted @ 2020-09-03 16:24 苏su 阅读(525) 评论(0) 推荐(0) 编辑

Kettle

摘要： 1.mysql->mysql（完全同字段数据同步）当然，实际此种情况当然可以选择navicat 1）打开spoon，连接资源库（推荐） 2）新建转换，之后在主对象树新建数据库连接并右键共享（统一数据源管理） 3）拖入一个表输入，配置连接信息，获取SQL语句，完成表输入配置（无变量情况） 4）拖一个阅读全文

posted @ 2020-09-03 16:01 苏su 阅读(293) 评论(0) 推荐(0) 编辑

ETL（数据仓库技术）

摘要： ETL是将业务系统的数据经过抽取、清洗转换之后加载到数据仓库的过程，目的是将企业中的分散、零乱、标准不统一的数据整合到一起，为企业的决策提供分析的依据。一.抽取方法有三种: 1、利用工具,例如kettle，dataX，Informatica 等。。。 2、利用存储过程. 3、前两种工具结合. 抽阅读全文

posted @ 2020-09-03 15:26 苏su 阅读(780) 评论(1) 推荐(0) 编辑

星形模型与雪花模型的区别

摘要： 1.星形的中心是一个大的事实表，发散出来的是维度表，每一个维度表用一个PK-FK（主键-主外键）连接到事实表，维度表之间彼此并不关联。一个事实表又包括一些度量值和维度。 2.雪花模型通过规范维度表来减少冗余度，也就是说，维度表数据已经被分组成一个个的表而不是使用一个大表。例如产品表被分成了产品大类和阅读全文

posted @ 2020-09-03 15:08 苏su 阅读(1163) 评论(0) 推荐(0) 编辑

退化维

摘要：退化维度一般来说事实表中的外键都对应一个维表，维的信息主要存放在维表中。但是退化维仅仅是事实表中的一列，这个维的相关信息都在这一列中，没有维表与之相关联。比如：发票号，序列号等等。那么退化维有什么作用呢？ 1、退化维具有普通维的各种操作，比如：上卷，切片，切块等 (上卷汇总，下钻明细；切片，切块阅读全文

posted @ 2020-09-03 14:38 苏su 阅读(356) 评论(0) 推荐(0) 编辑

Mapreduce怎么处理数据倾斜

摘要：数据倾斜： map /reduce程序执行时，reduce节点大部分执行完毕，但是有一个或者几个reduce节点运行很慢，导致整个程序的处理时间很长，这是因为某一个key的条数比其他key多很多（有时是百倍或者千倍之多），这条key所在的reduce节点所处理的数据量比其他节点就大很多，从而导致某几阅读全文

posted @ 2020-09-03 14:23 苏su 阅读(1233) 评论(0) 推荐(0) 编辑

MaxComputer-Pyodps之使用pyodps实现sql的循环

摘要：转自：https://yq.aliyun.com/articles/652356?spm=a2c4g.11186623.2.16.70be302emNbIDl 用过MaxComputer的同学，都知道MaxComputer SQL只支持常用DDLDML语句，不支持存储过程的开发，但我们常常为解决业务阅读全文

posted @ 2020-09-03 10:40 苏su 阅读(2547) 评论(0) 推荐(0) 编辑

帆软条件属性实现动态列

摘要： 1）添加控件 2）数据字典选择自定义 3）对需要做动态列的添加条件属性注：FIND 函数是当存在时返回地址，不存在时返回0，所以此处为当控件不存在时列宽为0，实现该列隐藏 4）实例展示阅读全文

posted @ 2020-09-03 10:37 苏su 阅读(1446) 评论(0) 推荐(0) 编辑

苏su

公告