摘要: 在完成数据加载之后,我们可能需要对事实表和维度表进行连接,这是对数据进行多维度拆解的基础; 我们可能从不同的数据源加载了结构相同的数据,我们需要将这些数据拼接起来;我们把这些操作统称为数据重塑。 当然,由于企业的信息化水平以及数据中台建设水平的差异,我们拿到的数据未必是质量很好的,可能还需要对数据中 阅读全文
posted @ 2024-06-10 00:26 little小新 阅读(21) 评论(0) 推荐(0) 编辑
摘要: 如果使用 pandas 做数据分析,那么DataFrame一定是被使用得最多的类型,它可以用来保存和处理异质的二维数据。 这里所谓的“异质”是指DataFrame中每个列的数据类型不需要相同,这也是它区别于 NumPy 二维数组的地方。 DataFrame提供了极为丰富的属性和方法,帮助我们实现对数 阅读全文
posted @ 2024-06-09 22:31 little小新 阅读(49) 评论(0) 推荐(0) 编辑
摘要: Pandas 是 Wes McKinney 在2008年开发的一个强大的分析结构化数据的工具集。Pandas 以 NumPy 为基础(实现数据存储和运算) 提供了专门用于数据分析的类型、方法和函数,对数据分析和数据挖掘提供了很好的支持; 同时 pandas 还可以跟数据可视化工具 matplotli 阅读全文
posted @ 2024-06-09 17:47 little小新 阅读(13) 评论(0) 推荐(0) 编辑
摘要: 数组的运算 使用 NumPy 最为方便的是当需要对数组元素进行运算时,不用编写循环代码遍历每个元素,所有的运算都会自动的矢量化。简单的说就是,NumPy 中的数学运算和数学函数会自动作用于数组中的每个成员。 # -*- coding: utf-8 -*- #数组的运算 #使用 NumPy 最为方便的 阅读全文
posted @ 2024-06-09 15:37 little小新 阅读(24) 评论(0) 推荐(0) 编辑
摘要: 数组对象的方法应用 # -*- coding: utf-8 -*- #数组对象的方法 import matplotlib.pyplot as plt import numpy # 1、 获取描述统计信息 array1 = numpy.random.randint(1, 100, 10) print( 阅读全文
posted @ 2024-06-09 14:03 little小新 阅读(9) 评论(0) 推荐(0) 编辑
摘要: 1、安装python 数据分析的三大神器 pip install numpy pandas matplotlib NumpPy 的说明 Numpy 是一个开源的 Python 科学计算库,用于快速处理任意维度的数组。Numpy 支持常见的数组和矩阵操作、 对于同样的数值计算任务,使用 NumPy 不 阅读全文
posted @ 2024-06-09 02:16 little小新 阅读(22) 评论(0) 推荐(0) 编辑
摘要: 服务自动拉起 本文档主要介绍如何配置 Doris 集群的自动拉起,保证生产环境中出现特殊情况导致服务宕机后未及时拉起服务从而影响到业务的正常运行。 Doris 集群必须完全搭建完成后再配置 FE 和 BE 的自动拉起服务。 Supervisor 配置 Doris 服务​ Supervisor 具体使 阅读全文
posted @ 2024-06-07 18:01 little小新 阅读(92) 评论(0) 推荐(0) 编辑
摘要: 算法:将原有的值通过一些算法来进行加密 对称算法(加密和解密的过程用的钥匙是相同的):AES\DES\3DES 非对称算法(加密和解密的过程中使用的钥匙是不一样的):DH\RSA hash算法:MD5 SSL 安全套接字 一份 SSL 证书包括: ·公共密钥:公共密钥用于加密信息 ·私用密钥:私用密 阅读全文
posted @ 2024-06-04 18:05 little小新 阅读(9) 评论(0) 推荐(0) 编辑
摘要: 1、购买阿里云服务器 2、安装nginx、打开访问 3、购买域名、域名解析、解析后可用域名去访问网站 4、购买ssl证书 5、这里我申请免费证书 验证通过后、提交审核即可 这一步表示证书已买好了、点击下载 下载完将证书包拉到服务器上的/etc/nginx 目录下 解压证书包:unzip 证书包名 配 阅读全文
posted @ 2024-06-04 18:03 little小新 阅读(12) 评论(0) 推荐(0) 编辑
摘要: 阅读全文
posted @ 2024-06-04 17:56 little小新 阅读(18) 评论(0) 推荐(0) 编辑