随笔分类 - 《使用python进行数据分析》笔记
学习《使用python进行数据分析》一书时的学习笔记。
环境:win10 python 3.7.3
摘要:本文章作为我的一系列关于《利用python进行数据分析》的笔记的文章的索引。分为四部分。 第一部分:numpy基础,共六节: numpy基础--ndarray(一种多维数组对象):https://www.cnblogs.com/mrlayfolk/p/12245315.html numpy基础--通
阅读全文
摘要:本节pandas库会用到,约定:import pandas as pd numpy库也会用到,约定:import numpy as np 3 日期范围、频率、移动 pandas中的时间序列一般被认为是不规则的,也就是说没有固定的频率。但pandas有一整套标准时间序列频率以及用于重采样、频率推断、生
阅读全文
摘要:本节pandas库会用到,约定:import pandas as pd numpy库也会用到,约定:import numpy as np 2 时间序列基础 pandas最基本的时间序列类型就是以时间戳(通常以python字符串或datetime对象表示)为索引的Series。 1 >>> from
阅读全文
摘要:1 时间序列-日期和时间数据类型 时间序列(time series)数据是一种重要的结构化数据形式,在多个时间点观察或测量到得任何事物都可以形成一段时间序列,很多时间序列是固定频率的。也就是说,数据点是根据某种规律定期出现的(比如15s、5min、1month)。时间序列也可以是不定期的。 时间序列
阅读全文
摘要:matplotlib API函数都位于matplotlib.pyplot模块中。 本节代码中引入的约定为:import matplotlib.pyplot as plt numpy库也会用到,约定:import numpy as np pandas库也会用到,约定:import pandas as
阅读全文
摘要:matplotlib API函数都位于matplotlib.pyplot模块中。 本节代码中引入的约定为:import matplotlib.pyplot as plt 另外,numpy库也会用到,约定:import numpy as np 1 matplotlib API入门 官方文档:Users
阅读全文
摘要:pandas含有是数据分析工作变得更快更简单的高级数据结构和操作工具,是基于numpy构建的。 本章节的代码引入pandas约定为:import pandas as pd,另外import numpy as np也会用到。 官方介绍:pandas - Python Data Analysis Lib
阅读全文
摘要:pandas含有是数据分析工作变得更快更简单的高级数据结构和操作工具,是基于numpy构建的。 本章节的代码引入pandas约定为:import pandas as pd,另外import numpy as np也会用到。 官方介绍:pandas - Python Data Analysis Lib
阅读全文
摘要:pandas含有是数据分析工作变得更快更简单的高级数据结构和操作工具,是基于numpy构建的。 本章节的代码引入pandas约定为:import pandas as pd,另外import numpy as np也会用到。 官方介绍:pandas - Python Data Analysis Lib
阅读全文
摘要:pandas含有是数据分析工作变得更快更简单的高级数据结构和操作工具,是基于numpy构建的。 本章节的代码引入pandas约定为:import pandas as pd,另外import numpy as np也会用到。 官方介绍:pandas - Python Data Analysis Lib
阅读全文
摘要:pandas含有是数据分析工作变得更快更简单的高级数据结构和操作工具,是基于numpy构建的。 本章节的代码引入pandas约定为:import pandas as pd,另外import numpy as np也会用到。 官方介绍:pandas - Python Data Analysis Lib
阅读全文
摘要:从本文开始介绍pandas的相关知识。 pandas含有是数据分析工作变得更快更简单的高级数据结构和操作工具,是基于numpy构建的。 本章节的代码引入pandas约定为:import pandas as pd,另外import numpy as np也会用到。 官方介绍:pandas - Pyth
阅读全文
摘要:从本文开始介绍pandas的相关知识。 pandas含有是数据分析工作变得更快更简单的高级数据结构和操作工具,是基于numpy构建的。 本章节的代码引入pandas约定为:import pandas as pd,另外import numpy as np也会用到。 官方介绍:pandas - Pyth
阅读全文
摘要:以下代码的前提:import numpy as np numpy.random模块对python内置的random进行了补充,增加了一些高效生成多种概率分布的样本值的函数。例如可以用normal来得到一个正态分布的样本数组。 1 >>> samples = np.random.normal(size
阅读全文
摘要:以下代码的前提:import numpy as np 线性代数(如矩阵乘法、矩阵分解、行列式以及其他方阵数学等)是任何数组库的重要组成部分。numpy提供了一个用于矩阵乘法的dot函数(既是一个数组方法也是numpy命名空间中的一个函数)。 矩阵乘法官方说明:numpy.dot — NumPy v1
阅读全文
摘要:以下代码的前提:import numpy as np numpy能够读写磁盘上的文本数据或二进制数据。 1 将数组以二进制格式保存到磁盘 np.save和np.load是读写磁盘数组数据的两个主要函数。默认情况下,数组是以未压缩的原始二进制格式保存在扩展名为.npy的文件中的。 通过np.savez
阅读全文
摘要:以下代码的前提:import numpy as np numpy数组可以将许多种数据处理任务表述为简洁的数组表达式,用数组表达式替换循环的做法,通常被称为矢量化。 官方说明文档:Array creation routines — NumPy v1.21 Manual 例如:我们想要处理一组值(网格型
阅读全文
摘要:以下代码的前提:import numpy as np 通用函数(即ufunc)是一种对narray中的数组执行元素级运算的函数。可以看作简单函数(接受一个或多个标量值,并产生一个或多个标量值)的矢量化包装器。 官方说明文档:Universal functions (ufunc) — NumPy v1
阅读全文
摘要:NumPy基本介绍 NumPy(Numerical Python)是高性能科学计算和数据分析的基础包。其提供了以下基本功能: ndarray:一种具有矢量算术运算和复杂广播能力的快速且节省空间的多维数组。 对整体数组进行快速的标准数学运算。 线性代数、随级数生成以及傅里叶变换功能。 提供简易的C A
阅读全文