08 2018 档案

摘要:seaborn官方文档:http://seaborn.pydata.org/api.html 绘制多变量的分布图 先绘制两个变量的分布图,其中X变量为分类变量,Y为数值变量。 运行结果: 注意:观察上图不难发现,带图默认是有抖动的,即 jitter=True 。下面用 swarmplot 绘制带分布 阅读全文
posted @ 2018-08-14 14:20 巴蜀秀才 阅读(6278) 评论(0) 推荐(0) 编辑
摘要:观测两个变量之间的分布关系 最好用散点图 两个便量间的分布关系: 运行结果: 用 “类蜂窝” 结构展示数据的分布: 运行结果: 多维数据间的分布关系 运行结果: 绘制回归关系 regplot()和lmplot()都可以绘制回归关系,推荐regplot() 运行结果: 用DataFrame数据画图 用 阅读全文
posted @ 2018-08-13 23:31 巴蜀秀才 阅读(9290) 评论(1) 推荐(0) 编辑
摘要:绘制数据的直方图及其概率密度曲线 这里可以使用 seaborn.displot() 来绘制,如果指定kde参数为False,就不会画概率密度曲线 运行结果: 下面展示没有概率密度曲线的直方图和用gamma拟合的概率密度曲线: 运行结果: 在一个画布上绘制多条曲线 运行结果: 我们可以恢复seabor 阅读全文
posted @ 2018-08-13 22:02 巴蜀秀才 阅读(17531) 评论(0) 推荐(1) 编辑
摘要:绘制bar图,类似于直方图: 运行结果: 此时我们可以调整参数,让图更美观。 运行结果: 在很多时候,我们更希望这种图可以横着画,我们可以在画图的时候使用 ax.barh() 去画,其他命令一样。 效果如下:(这里是pycharm的效果,右边显示不完全) 绘制散点图 ax.scatter() 用来绘 阅读全文
posted @ 2018-08-13 10:28 巴蜀秀才 阅读(1484) 评论(0) 推荐(0) 编辑
摘要:打开画布,传入x,y的值,可以简单的画出曲线图 运行结果: 画出来的图像简单,且单调。一般为了美观我们需要更多的参数指定。 对x轴的一些操作 如下案例: 运行结果: 添加横坐标标签和纵坐标标签,以及标题 运行结果: 在一个画布上花多个子图 运行结果: 此时,也许你会疑惑,我们想将坐标标识等示例画到第 阅读全文
posted @ 2018-08-12 22:55 巴蜀秀才 阅读(642) 评论(0) 推荐(0) 编辑
摘要:数据聚合(GroupBy) 输出结果: 令x = group.sum(), 则可以取值为: x.values x.values Out[20]: array([2.75, 1.3 , 0.56, 4.2 , 5.56]) 等级分组 输出结果: 组迭代 链式转换 输出结果: 阅读全文
posted @ 2018-08-03 16:23 巴蜀秀才 阅读(2057) 评论(0) 推荐(0) 编辑
摘要:数据转换 删除重复元素 DataFrame对象的duplicated()函数可用来检测重复的行,返回元素为布尔型的Series对象。 每个元素对 应一行,如果该行与其他行重复(也就是说该行不是第一次出现),则元素为True; 如果跟前面不重复,则元 素就为False。 返回元素为布尔值的Series 阅读全文
posted @ 2018-08-03 11:32 巴蜀秀才 阅读(4210) 评论(0) 推荐(0) 编辑
摘要:对于合并操作,熟悉SQL的读者可以将其理解为JOIN操作,它使用一个或多个键把多行数据 结合在一起. 事实上,跟关系型数据库打交道的开发人员通常使用SQL的JOIN查询,用几个表共有的引用 值(键)从不同 的表获取数据。以这些键为基础,我们能够获取到列表形式的新数据,这些数据是对几个表中的数据进行组 阅读全文
posted @ 2018-08-02 23:16 巴蜀秀才 阅读(1298) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示