随笔分类 - 数据分析学习笔记
此笔记为业余时间学习数据分析笔记
摘要:DateFrame DateFrame:一个二维标记数据结构,具有可能不同类型的列,每一列可以是不同值类型(数值,字符串,布尔值),既有行索引也有列索引。我们可以把它看作为excel表格,或者SQL表,或Series对象的字典。 构建DateFrame的方法: 字典类:数组、列表或元组构成的字典构造
阅读全文
摘要:series的基本用法 1、is null 和 not null 检查缺失值 s4.isnull() #判断是否为空,空就是True city False name False age False sex True dtype: bool s4.notnull() # 判断是否不为空,非空就是Tru
阅读全文
摘要:Numpy数组操作 索引和切片: 获取某行的数据: # 1. 如果是一维数组 a1 = np.arange(0,29) print(a1[1]) #获取下标为1的元素 a1 = np.arange(0,24).reshape((4,6)) print(a1[1]) #获取下标为1的行的数据 连续获取
阅读全文
摘要:一、Numpy数组基本用法 1、Numpy是Python科学计算库,用于快速处理任意维度的数组。 2、NumPy提供一个N维数组类型ndarray,它描述了相同类型的“items”的集合。 3、numpy.ndarray支持向量化运算。 4、NumPy使用c语言写的,底部解除了GIL,其对数组的操作
阅读全文
摘要:Numpy库简单介绍 NumPy是一个功能强大的Python库,主要用于对多维数组执行计算。NumPy这个词来源于两个单词-- Numerical和Python。NumPy提供了大量的库函数和操作,可以帮助程序员轻松地进行数值计算。在数据分析和机器学习领域被广泛使用。他有以下几个特点: numpy内
阅读全文
摘要:pandas的数据结构-series Series 1、Series介绍 Series:一种一维标记的数组型对象,能够保存任何数据类型(int, str, float, python object...),包含了数据标签,称为索引。 类似一维数组的对象,index = ['名字','年龄','班级'
阅读全文
摘要:1、为什么要学习pandas numpy已经能够帮助我们处理数据,能够结合matplotlib解决我们数据分析的问题,那么pandas学习的目的在什么地方呢? numpy能够帮我们处理处理数值型数据,但是这还不够, 很多时候,我们的数据除了数值之外,还有字符串,还有时间序列等 比如:我们通过爬虫获取
阅读全文
摘要:环境搭建 1、Anaconda Anaconda(水蟒)是一个捆绑了Python、conda、其他相关依赖包的一个软件。包含了180多个可学计算包及其依赖。Anaconda3是集成了Python3的环境,Anaconda2是集成了Python2的环境。Anaconda默认集成的包,是属于内置的Pyt
阅读全文