04 2021 档案

摘要:Python爬虫、数据分析、网站开发等案例教程视频免费在线观看 https://space.bilibili.com/523606542 Python学习交流群:1039649593 多图布局 解决元素重叠的问题: 在一个Figure上面,可能存在多个Axes对象,如果Figure比较小,那么有可能 阅读全文
posted @ 2021-04-26 16:32 松鼠爱吃饼干 阅读(609) 评论(0) 推荐(0) 编辑
摘要:解释: Figure:图形绘制的画板,他就相当于一个黑板,所有的图都是绘制在Figure上面。 Axes:每个图都是Axes对象。一个Figure上可以有多个Axes对象。 Axis:x轴、y轴的对象。 Tick:x轴和y轴上的刻度对象。每一个刻度都是一个Tick对象。 TickLabel:每个刻度 阅读全文
posted @ 2021-04-26 14:39 松鼠爱吃饼干 阅读(567) 评论(0) 推荐(0) 编辑
摘要:Axis容器: Axis代表的是x轴或者y轴的对象。包含Tick(刻度)对象,TickLabel刻度文本对象,以及AxisLabel坐标轴文本对象。axis对象有一些方法可以操作刻度和文本等。 Python爬虫、数据分析、网站开发等案例教程视频免费在线观看 https://space.bilibil 阅读全文
posted @ 2021-04-23 15:03 松鼠爱吃饼干 阅读(368) 评论(0) 推荐(0) 编辑
摘要:Axes容器: Axes容器是用来创建具体的图形的。比如画曲线,柱状图,都是画在上面。所以之前我们学的使用plt.xx绘制各种图形(比如条形图,直方图,散点图等)都是对Axes的封装。比如plt.plot对应的是axes.plot,比如plt.hist对应的是axes.hist。针对图的所有操作,都 阅读全文
posted @ 2021-04-20 16:40 松鼠爱吃饼干 阅读(873) 评论(0) 推荐(0) 编辑
摘要:解释: Figure:图形绘制的画板,他就相当于一个黑板,所有的图都是绘制在Figure上面。 Axes:每个图都是Axes对象。一个Figure上可以有多个Axes对象。 Axis:x轴、y轴的对象。 Tick:x轴和y轴上的刻度对象。每一个刻度都是一个Tick对象。 TickLabel:每个刻度 阅读全文
posted @ 2021-04-20 14:26 松鼠爱吃饼干 阅读(743) 评论(0) 推荐(0) 编辑
摘要:雷达图 雷达图(Radar Chart)又被叫做蜘蛛网图,适用于显示三个或更多的维度的变量的强弱情况。比如英雄联盟中某个影响的属性(法术伤害,物理防御等),或者是某个企业在哪些业务方面的投入等,都可以用雷达图方便的表示。 使用plt.polar绘制雷达图: 在matplotlib.pyplot中,可 阅读全文
posted @ 2021-04-17 14:55 松鼠爱吃饼干 阅读(2431) 评论(0) 推荐(0) 编辑
摘要:箱线图 箱线图(Box-plot)又称为盒须图、盒式图或箱型图,是一种用作显示一组数据分散情况资料的统计图。因形状如箱子而得名。在各种领域也经常被使用,它主要用于反映原始数据分布的特征,还可以进行多组数据分布特征的比较。箱线图的绘制方法是:先找出一组数据的上限值、下限值、中位数(Q2)和下四分位数( 阅读全文
posted @ 2021-04-16 15:57 松鼠爱吃饼干 阅读(3315) 评论(0) 推荐(0) 编辑
摘要:饼图 饼图是一个划分为几个扇形的圆形统计图表,用于描述量、频率或百分比之间的相对关系的。 在matplotlib中,可以通过plt.pie来实现,其中的参数如下: x:饼图的比例序列。 labels:饼图上每个分块的名称文字。 explode:设置某几个分块是否要分离饼图。 autopct:设置比例 阅读全文
posted @ 2021-04-16 14:56 松鼠爱吃饼干 阅读(2023) 评论(0) 推荐(0) 编辑
摘要:散点图 散点图也叫 X-Y 图,它将所有的数据以点的形式展现在直角坐标系上,以显示变量之间的相互影响程度,点的位置由变量的数值决定。 通过观察散点图上数据点的分布情况,我们可以推断出变量间的相关性。如果变量之间不存在相互关系,那么在散点图上就会表现为随机分布的离散的点,如果存在某种相关性,那么大部分 阅读全文
posted @ 2021-04-16 13:43 松鼠爱吃饼干 阅读(1800) 评论(0) 推荐(0) 编辑
摘要:直方图(Histogram),又称质量分布图,是一种统计报告图,由一系列高度不等的条纹表示数据分布的情况。一般用横轴表示数据类型,纵轴表示分布情况。 直方图是数值数据分布的精确图形表示。为了构建直方图,第一步是将值的范围分段,即将整个值的范围分成一系列间隔,然后计算每个间隔中有多少值。这些值通常被指 阅读全文
posted @ 2021-04-15 14:01 松鼠爱吃饼干 阅读(2871) 评论(0) 推荐(0) 编辑
摘要:条形图的绘制方式跟折线图非常的类似,只不过是换成了plt.bar方法。plt.bar方法有以下常用参数: x:一个数组或者列表,代表需要绘制的条形图的x轴的坐标点。 height:一个数组或者列表,代表需要绘制的条形图y轴的坐标点。 width:每一个条形图的宽度,默认是0.8的宽度。 bottom 阅读全文
posted @ 2021-04-14 15:27 松鼠爱吃饼干 阅读(1312) 评论(0) 推荐(0) 编辑
摘要:现在我们添加图后,没有指定x轴代表什么,y轴代表什么,以及这个图的标题是什么。因此以下我们通过一些属性来设置一下。 设置线条样式: 使用plot方法:plot方法就是用来绘制线条的,因此可以在绘制的时候就把线条相关的样式通过参数传进去。示例代码如下: plt.plot(x,y,linewidth=2 阅读全文
posted @ 2021-04-13 22:45 松鼠爱吃饼干 阅读(845) 评论(0) 推荐(0) 编辑
摘要:Matplotlib是一个Python的2D绘图库,通过Matplotlib,开发者可以仅需要几行代码,便可以生成折线图,直方图,条形图,饼状图,散点图等。 安装: 如果是用Anaconda,可以通过conda install matplotlib或者通过pip install matplotlib 阅读全文
posted @ 2021-04-13 18:53 松鼠爱吃饼干 阅读(645) 评论(0) 推荐(0) 编辑
摘要:折线图: 折线图用于显示数据在一个连续的时间间隔或者时间跨度上的变化,它的特点是反映事物随时间或有序类别而变化的趋势。示例图如下: 折线图应用场景: 折线图适合X轴是一个连续递增或递减的,对于没有规律的,则不适合使用折线图,建议使用柱状图。 如果折线图条数过多,则不应该都绘制在一个图上。 柱状图: 阅读全文
posted @ 2021-04-10 14:51 松鼠爱吃饼干 阅读(824) 评论(0) 推荐(1) 编辑
摘要:时间序列(time series)数据是一种重要的结构化数据形式,。在多个时间点观察或测量到的任何时间都可以形成一段时间序列。很多时间, 时间序列是固定频率的, 也就是说, 数据点是根据某种规律定期出现的(比如每15秒。。。。)。时间序列也可以是不定期的。时间序列数据的意义取决于具体的应用场景。主要 阅读全文
posted @ 2021-04-09 20:40 松鼠爱吃饼干 阅读(675) 评论(0) 推荐(0) 编辑
摘要:什么是分组聚合? 如图: groupby:(by=None,as_index=True) by:根据什么进行分组,用于确定groupby的组 as_index:对于聚合输出,返回以组便签为索引的对象,仅对DataFrame df1 = pd.DataFrame({'fruit':['apple',' 阅读全文
posted @ 2021-04-09 19:15 松鼠爱吃饼干 阅读(389) 评论(0) 推荐(0) 编辑
摘要:数据合并(pd.merge) 根据单个或多个键将不同DataFrame的行连接起来 类似数据库的连接操作 pd.merge:(left, right, how='inner',on=None,left_on=None, right_on=None )left:合并时左边的DataFrameright 阅读全文
posted @ 2021-04-08 20:58 松鼠爱吃饼干 阅读(754) 评论(0) 推荐(0) 编辑
摘要:数据清洗是数据分析关键的一步,直接影响之后的处理工作 数据需要修改吗?有什么需要修改的吗?数据应该怎么调整才能适用于接下来的分析和挖掘? 是一个迭代的过程,实际项目中可能需要不止一次地执行这些清洗操作 1. 处理缺失数据: pd.fillna() pd.dropna() 2. 数据转换 2.1 处理 阅读全文
posted @ 2021-04-08 15:28 松鼠爱吃饼干 阅读(467) 评论(0) 推荐(0) 编辑
摘要:csv文件 读取csv文件read_csv(file_path or buf,usecols,encoding):file_path:文件路径,usecols:指定读取的列名,encoding:编码 data = pd.read_csv('d:/test_data/food_rank.csv',en 阅读全文
posted @ 2021-04-07 18:55 松鼠爱吃饼干 阅读(330) 评论(0) 推荐(0) 编辑
摘要:示例代码: arr1 = np.random.rand(4,3) pd1 = pd.DataFrame(arr1,columns=list('ABC'),index=list('abcd')) f = lambda x: '%.2f'% x pd2 = pd1.applymap(f).astype( 阅读全文
posted @ 2021-04-07 16:10 松鼠爱吃饼干 阅读(411) 评论(0) 推荐(0) 编辑
摘要:下面创建一个Series, 在输入索引Index时,输入了由两个子list组成的list,第一个子list是外层索引,第二个list是内层索引。 示例代码: import pandas as pd import numpy as np ser_obj = pd.Series(np.random.ra 阅读全文
posted @ 2021-04-06 16:24 松鼠爱吃饼干 阅读(394) 评论(0) 推荐(0) 编辑
摘要:apply和applymap 1. 可直接使用NumPy的函数 示例代码: # Numpy ufunc 函数 df = pd.DataFrame(np.random.randn(5,4) - 1) print(df) print(np.abs(df)) 运行结果: 0 1 2 3 0 -0.0624 阅读全文
posted @ 2021-04-06 14:09 松鼠爱吃饼干 阅读(311) 评论(0) 推荐(0) 编辑
摘要:是数据清洗的重要过程,可以按索引对齐进行运算,如果没对齐的位置则补NaN,最后也可以填充NaN Series的对齐运算 1. Series 按行、索引对齐 示例代码: s1 = pd.Series(range(10, 20), index = range(10)) s2 = pd.Series(ra 阅读全文
posted @ 2021-04-01 13:35 松鼠爱吃饼干 阅读(925) 评论(0) 推荐(0) 编辑

Title
点击右上角即可分享
微信分享提示