01 2022 档案

摘要:Matplotlib 中的 pyplot 模块是一个类似命令风格的函数集合,这使得 Matplotlib 的工作模式和 MATLAB 相似。pyplot 模块提供了可以用来绘图的各种函数,比如创建一个画布,在画布中创建一个绘图区域,或是在绘图区域添加一些线、标签等。以下表格对这些函数做了简单地介绍。 阅读全文
posted @ 2022-01-29 16:26 shirly_zhang 阅读(530) 评论(0) 推荐(0) 编辑
摘要:随机抽样,是统计学中常用的一种方法,它可以帮助我们从大量的数据中快速地构建出一组数据分析模型。在 Pandas 中,如果想要对数据集进行随机抽样,需要使用 sample() 函数。sample() 函数的语法格式如下: DataFrame.sample(n=None, frac=None, repl 阅读全文
posted @ 2022-01-29 14:28 shirly_zhang 阅读(1302) 评论(0) 推荐(0) 编辑
摘要:Pandas 在数据分析、数据可视化方面有着较为广泛的应用,Pandas 对 Matplotlib 绘图软件包的基础上单独封装了一个plot()接口,通过调用该接口可以实现常用的绘图操作。本节我们深入讲解一下 Pandas 的绘图操作。Pandas 之所以能够实现了数据可视化,主要利用了 Matpl 阅读全文
posted @ 2022-01-29 14:22 shirly_zhang 阅读(85) 评论(0) 推荐(0) 编辑
摘要:“去重”通过字面意思不难理解,就是删除重复的数据。在一个数据集中,找出重复的数据删并将其删除,最终只保存一个唯一存在的数据项,这就是数据去重的整个过程。删除重复数据是数据分析中经常会遇到的一个问题。通过数据去重,不仅可以节省内存空间,提高写入性能,还可以提升数据集的精确度,使得数据集不受重复数据的影 阅读全文
posted @ 2022-01-29 13:57 shirly_zhang 阅读(3921) 评论(0) 推荐(0) 编辑
摘要:如果想要应用自定义的函数,或者把其他库中的函数应用到 Pandas 对象中,有以下三种方法: 1) 操作整个 DataFrame 的函数:pipe() 2) 操作行或者列的函数:apply() 3) 操作单一元素的函数:applymap() 如何从上述函数中选择适合的函数,这取决于函数的操作对象。下 阅读全文
posted @ 2022-01-29 11:28 shirly_zhang 阅读(328) 评论(0) 推荐(0) 编辑
摘要:Python提供了多个内置模块用于操作日期时间 datetime模块定义了两个常量:datetime.MINYEAR和datetime.MAXYEAR,分别表示datetime所能表示的最 小、最大年份。其中,MINYEAR = 1,MAXYEAR = 9999。 datetime模块定义了下面这几 阅读全文
posted @ 2022-01-28 16:46 shirly_zhang 阅读(186) 评论(0) 推荐(0) 编辑
摘要:1、读取数据 import pandas as pd import numpy as np import os import shutil import dateutil wd = os.getcwd() os.listdir(wd) path='/Users/xiaoli.zhang/Docume 阅读全文
posted @ 2022-01-28 15:41 shirly_zhang 阅读(231) 评论(0) 推荐(0) 编辑
摘要:DataFrame(2):DataFrame常用属性说明 1、常用属性如下 ndim 返回DataFrame的维数; shape 返回DataFrame的形状; dtypes 返回DataFrame中每一列元素的数据类型; size 返回DataFrame中元素的个数; T 返回DataFrame的 阅读全文
posted @ 2022-01-28 13:46 shirly_zhang 阅读(263) 评论(0) 推荐(0) 编辑
摘要:DataFrame的排序与排名问题 1、说明 DataFrame中的排序分为两种,一种是对索引排序,一种是对值进行排序。 索引排序:sort_index(); 值排序:sort_values(); 值排名:rank() 对于索引排序,涉及到对行索引、列索引的排序,并且还涉及到是升序还是降序。函数df 阅读全文
posted @ 2022-01-28 13:44 shirly_zhang 阅读(829) 评论(0) 推荐(0) 编辑
摘要:构造数据集 import pandas as pd df ={'姓名':[' 黄同学','黄至尊','黄老邪 ','陈大美','孙尚香'], '英文名':['Huang tong_xue','huang zhi_zun','Huang Lao_xie','Chen Da_mei','sun shan 阅读全文
posted @ 2022-01-28 13:41 shirly_zhang 阅读(346) 评论(0) 推荐(0) 编辑
摘要:DataFrame之合并组合 在Pandas的实践过程中,我们经常需要将两个DataFrame合并组合在一起再进行处理,比如将不同来源的数据合并在一起,或者将不同日期的DataFrame合并在一起。 DataFrame的合并组合从方向上分,大体上分为两种情况:横向的,纵向的。 看下如下的图示(图片来 阅读全文
posted @ 2022-01-28 13:39 shirly_zhang 阅读(1372) 评论(0) 推荐(0) 编辑
摘要:认识DataFrame结构 DataFrame 一个表格型的数据结构,既有行标签(index),又有列标签(columns),它也被称异构数据表,所谓异构,指的是表格中每列的数据类型可以不同,比如可以是字符串、整型或者浮点型等。其结构图示意图,如下所示: 表格中展示了某个销售团队个人信息和绩效评级( 阅读全文
posted @ 2022-01-28 12:00 shirly_zhang 阅读(732) 评论(0) 推荐(0) 编辑
摘要:1、txt文件打开方式 f = open("data.txt","r") #设置文件对象 f.close() #关闭文件 #为了方便,避免忘记close掉这个文件对象,可以用下面这种方式替代 with open('data.txt',"r") as f: #设置文件对象 str = f.read() 阅读全文
posted @ 2022-01-28 11:56 shirly_zhang 阅读(63) 评论(0) 推荐(0) 编辑
摘要:1、csv文件读取 import pandas as pd csv_data = pd.read_csv('birth_weight.csv') # 读取训练数据 print(csv_data.shape) # (189, 9) N = 5 csv_batch_data = csv_data.tai 阅读全文
posted @ 2022-01-28 11:40 shirly_zhang 阅读(47) 评论(0) 推荐(0) 编辑
摘要:1、Excel文件读取 import pandas as pd import numpy as np data=pd.read_excel('/Users/xxx/data.xlsx',sheet_name=1,names=['F1','F2','F3','F4','F5','F6','F7'],h 阅读全文
posted @ 2022-01-28 11:35 shirly_zhang 阅读(288) 评论(0) 推荐(0) 编辑
摘要:os模块 文件路径的获取、修改;文件的更改及删除 import osimport shutilwd = os.getcwd() #获取当前文件路径os.listdir(wd) #列举路径下文件path='/Users/xiaoli.zhang/Documents/'os.chdir(path) #修 阅读全文
posted @ 2022-01-28 11:24 shirly_zhang 阅读(54) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示