随笔分类 -  python学习 / 数据分析

摘要:气泡图 # -*- coding: utf-8 -*- #气泡图 #气泡图可以用来了解三个变量之间的关系,通过比较气泡位置和大小来分析数据维度之间的相关性。 #例如在我们之前绘制的月收入和网购支出的散点图中,我们已经发现了二者的正相关关系,如果我们引入第三个变量网购次数,那么我们就需要使用气泡图来进 阅读全文
posted @ 2024-06-12 16:43 little小新 阅读(141) 评论(0) 推荐(0) 编辑
摘要:曲线图 # -*- coding: utf-8 -*- #基础、曲线图 import numpy import matplotlib.pyplot as plt #设置字体 SimHei: 黑体 #需要注意的是,使用中文字体后坐标轴上的负号将会无法显示,需要将`axes.unicode_minus` 阅读全文
posted @ 2024-06-12 15:24 little小新 阅读(55) 评论(0) 推荐(0) 编辑
摘要:经过前面的学习,我们已经将数据准备就绪而且变成了我们想要的样子 接下来就是最为重要的数据透视阶段了。当我们拿到一大堆数据的时候,如何从数据中迅速的解读出有价值的信息 把繁杂的数据变成容易解读的统计图表并再此基础上产生业务洞察,这就是数据分析要解决的核心问题。 数据透视 # -*- coding: u 阅读全文
posted @ 2024-06-10 14:03 little小新 阅读(47) 评论(0) 推荐(0) 编辑
摘要:在完成数据加载之后,我们可能需要对事实表和维度表进行连接,这是对数据进行多维度拆解的基础; 我们可能从不同的数据源加载了结构相同的数据,我们需要将这些数据拼接起来;我们把这些操作统称为数据重塑。 当然,由于企业的信息化水平以及数据中台建设水平的差异,我们拿到的数据未必是质量很好的,可能还需要对数据中 阅读全文
posted @ 2024-06-10 00:26 little小新 阅读(35) 评论(0) 推荐(0) 编辑
摘要:如果使用 pandas 做数据分析,那么DataFrame一定是被使用得最多的类型,它可以用来保存和处理异质的二维数据。 这里所谓的“异质”是指DataFrame中每个列的数据类型不需要相同,这也是它区别于 NumPy 二维数组的地方。 DataFrame提供了极为丰富的属性和方法,帮助我们实现对数 阅读全文
posted @ 2024-06-09 22:31 little小新 阅读(64) 评论(0) 推荐(0) 编辑
摘要:Pandas 是 Wes McKinney 在2008年开发的一个强大的分析结构化数据的工具集。Pandas 以 NumPy 为基础(实现数据存储和运算) 提供了专门用于数据分析的类型、方法和函数,对数据分析和数据挖掘提供了很好的支持; 同时 pandas 还可以跟数据可视化工具 matplotli 阅读全文
posted @ 2024-06-09 17:47 little小新 阅读(43) 评论(0) 推荐(0) 编辑
摘要:数组的运算 使用 NumPy 最为方便的是当需要对数组元素进行运算时,不用编写循环代码遍历每个元素,所有的运算都会自动的矢量化。简单的说就是,NumPy 中的数学运算和数学函数会自动作用于数组中的每个成员。 # -*- coding: utf-8 -*- #数组的运算 #使用 NumPy 最为方便的 阅读全文
posted @ 2024-06-09 15:37 little小新 阅读(37) 评论(0) 推荐(0) 编辑
摘要:数组对象的方法应用 # -*- coding: utf-8 -*- #数组对象的方法 import matplotlib.pyplot as plt import numpy # 1、 获取描述统计信息 array1 = numpy.random.randint(1, 100, 10) print( 阅读全文
posted @ 2024-06-09 14:03 little小新 阅读(11) 评论(0) 推荐(0) 编辑
摘要:1、安装python 数据分析的三大神器 pip install numpy pandas matplotlib NumpPy 的说明 Numpy 是一个开源的 Python 科学计算库,用于快速处理任意维度的数组。Numpy 支持常见的数组和矩阵操作、 对于同样的数值计算任务,使用 NumPy 不 阅读全文
posted @ 2024-06-09 02:16 little小新 阅读(35) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示