摘要: import osimport datetimefrom glob2 import globfrom ntpath import relpathimport errno# from MyTest3 import file# from MyTest3 import configclass Handle 阅读全文
posted @ 2023-01-31 10:07 咪嗞哈嘻 阅读(13) 评论(0) 推荐(0) 编辑
摘要: 阅读全文
posted @ 2023-01-31 10:07 咪嗞哈嘻 阅读(13) 评论(0) 推荐(0) 编辑
摘要: import datetimeclass DBClient(object): ''' classdocs ''' imp_module = "cx_Oracle" connection = None cursor = None conn_str = '' exec_params = {} enabl 阅读全文
posted @ 2023-01-31 10:02 咪嗞哈嘻 阅读(13) 评论(0) 推荐(0) 编辑
摘要: import osimport sysimport datetimefrom DBClient import DBClientfrom HandleFileClass import HandleFileClassfrom importlib import import_modulefrom sqla 阅读全文
posted @ 2023-01-31 10:01 咪嗞哈嘻 阅读(8) 评论(0) 推荐(0) 编辑
摘要: 阅读全文
posted @ 2023-01-31 09:27 咪嗞哈嘻 阅读(4) 评论(0) 推荐(0) 编辑
摘要: 阅读全文
posted @ 2023-01-31 09:23 咪嗞哈嘻 阅读(12) 评论(0) 推荐(0) 编辑
摘要: 1、WHERE与HAVING区别:——都可过滤数据 1、执行顺序不同:汇总查询时,WHERE在GROUP BY前执行,HAVING在GROUP BY后执行。 2、过滤条件不同:HAVING中可使用聚合函数,WHERE中不可以使用聚合函数。且WHERE的条件可以在HAVING中,反之不成立。 3、使用 阅读全文
posted @ 2023-01-31 09:18 咪嗞哈嘻 阅读(28) 评论(0) 推荐(0) 编辑
摘要: Tableau 1、Tableau安装包链接:https://pan.baidu.com/s/1K8i5NWHF58JFHcV_p8RORA?pwd=xing提取码:xing 2、相关资源我们这里采取替换tabui.dll文件就行,刚刚入门的可以采取这种方式来学习一下。帮助文档手册下载: https 阅读全文
posted @ 2023-01-31 09:17 咪嗞哈嘻 阅读(90) 评论(0) 推荐(0) 编辑
摘要: 一,什么是数据库分区 前段时间写过一篇关于mysql分表的的文章,下面来说一下什么是数据库分区,以mysql为例。mysql数据库中的数据是以文件的形势存在磁盘上的,默认放在/mysql/data下面(可以通过my.cnf中的datadir来查看),一张表主要对应着三个文件,一个是frm存放表结构的 阅读全文
posted @ 2023-01-31 09:15 咪嗞哈嘻 阅读(282) 评论(0) 推荐(0) 编辑
摘要: 资料来源:https://baijiahao.baidu.com/s?id=1716481856789644662&wfr=spider&for=pc一文搞懂:离线数据、实时数据究竟该如何选择 在业务分析过程中,你应该选择实时数据还是离线数据?这需要依据业务场景来进行判断,不能盲目选择。那么,二者的 阅读全文
posted @ 2023-01-31 09:14 咪嗞哈嘻 阅读(65) 评论(0) 推荐(0) 编辑
摘要: 好多同学对sql的优化好像是知道的甚少,最近总结了以下34条仅供参考。 (1)选择最有效率的表名顺序(只在基于规则的优化器中有效): ORACLE的解析器按照从右到左的顺序处理FROM子句中的表名,FROM子句中写在最后的表(基础表 driving table)将被最先处理,在FROM子句中包含多个 阅读全文
posted @ 2023-01-31 09:13 咪嗞哈嘻 阅读(29) 评论(0) 推荐(0) 编辑
摘要: 1.对查询进行优化,应尽量避免全表扫描,首先应考虑在 where 及 order by 涉及的列上建立索引。 2.应尽量避免在 where 子句中对字段进行 null 值判断,否则将导致引擎放弃使用索引而进行全表扫描,如: select id from t where num is null可以在n 阅读全文
posted @ 2023-01-31 09:13 咪嗞哈嘻 阅读(30) 评论(0) 推荐(0) 编辑
摘要: (1)SparkSQL电子书:http://marsishandsome.github.io/SparkSQL-Internal/ (来源:https://www.zhihu.com/question/31427697)(2)B站入门视频:https://www.bilibili.com/video 阅读全文
posted @ 2023-01-31 09:12 咪嗞哈嘻 阅读(68) 评论(0) 推荐(0) 编辑
摘要: 作者:五分钟学大数据链接:https://www.zhihu.com/question/31427697/answer/2204776776 1. Spark 的运行流程?<img src="https://pic3.zhimg.com/50/v2-b34da00bc67564b8e3289757d 阅读全文
posted @ 2023-01-31 09:11 咪嗞哈嘻 阅读(27) 评论(0) 推荐(0) 编辑
摘要: https://blog.csdn.net/weixin_39032019/article/details/120239321?ops_request_misc=%257B%2522request%255Fid%2522%253A%2522165762280716782425136365%2522% 阅读全文
posted @ 2023-01-31 09:11 咪嗞哈嘻 阅读(12) 评论(0) 推荐(0) 编辑
摘要: 数据中台 一、数仓分层1.1分层概念 ods:原始数据层,存放原始数据。 dwd:明细数据层,对原始数据进行清洗,如去空值、日期格式转换、数据脱敏、脏数据处理等。 dws:数据服务层,对明细数据层进行轻度汇总。 dwt:数据主题层,以dws层为基础,进行数据累积汇总。 ads:数据应用层,为数据应用 阅读全文
posted @ 2023-01-31 09:07 咪嗞哈嘻 阅读(108) 评论(0) 推荐(0) 编辑
摘要: 数据建模方法论及实施步骤 了解数据建模之前首先要知道的是什么是数据模型。数据模型(Data Model)是数据特征的抽象,它从抽象层次上描述了系统的静态特征、动态行为和约束条件,为数据库系统的信息表示与操作提供一个抽象的框架。 一、概要:数据建模简介 数据基本用于两种目的:1、操作型记录的保存2、分 阅读全文
posted @ 2023-01-31 09:06 咪嗞哈嘻 阅读(55) 评论(0) 推荐(0) 编辑
摘要: 阅读全文
posted @ 2023-01-31 09:02 咪嗞哈嘻 阅读(12) 评论(0) 推荐(0) 编辑
摘要: 1. pandas:数据分析类库基于NumPy,为了解决数据分析任务而创建的工具。Pandas的名称来自于面板数据(panel data)和python数据分析(data analysis)。Pandas最初被作为金融数据分析工具而开发,为时间序列分析提供了很好的支持。panel data是经济学中 阅读全文
posted @ 2023-01-31 09:00 咪嗞哈嘻 阅读(142) 评论(0) 推荐(0) 编辑
摘要: 数据仓库 在实际工作中,数仓分层、元数据管理、数据质量管理一直是一个持续优化的过程,我们公司业务也是在持续的做数仓的优化工作,在数据治理这方面还是欠缺很多的经验的。下面先简单整理了一下第一个理论部分的相关笔记。 一、数据仓库理论(1)数据仓库四大特征面向主题:较高层次上企业信息系统中的数据综合、归类 阅读全文
posted @ 2023-01-31 09:00 咪嗞哈嘻 阅读(240) 评论(0) 推荐(0) 编辑