06 2023 档案
摘要:在numpy中,数组可以看作是一系列数值的有序集合,可以通过下标访问其中的元素。处理数组的过程中,经常需要用到数组过滤功能。 过滤功能可以在处理数据时非常有用,因为它可以使数据更加干净和可读性更强。例如,在进行数据分析时,通常需要去除异常值,过滤掉不必要的元素可以使数据更加易于分析和处理。 nump
阅读全文
摘要:numpy的广播计算是指在多维数组上进行的一种高效计算方式。 它可以将计算任务分配到每个维度上,并且可以在计算过程中进行数据共享和同步,从而提高计算效率和精度。 广播计算在数值计算、科学计算、机器学习等领域都有广泛的应用。 例如,在数值计算中,广播计算可以用于求解大规模的非线性方程组;在科学计算中,
阅读全文
摘要:上一篇介绍的通用计算是关于多个numpy数组的计算, 本篇介绍的聚合计算一般是针对单个数据集的各种统计结果,同样,使用聚合函数,也可以避免繁琐的循环语句的编写。 元素的和 数组中的元素求和也就是合计值。 调用方式 聚合计算有两种调用方式,一种是面向对象的方式,作为numpy数组对象的方法来调用: i
阅读全文
摘要:numpy提供了简单灵活的接口,用于优化数据数组的计算。 通用计算最大的优势在于通过向量化操作,将循环推送至numpy之下的编译层,从而取得更快的执行效率。 numpy的通用计算让我们计算数组时就像计算单独一个变量一样, 不用写循环去遍历数组中的各个元素。 比如,对于一般的python二维数组,我们
阅读全文
摘要:numpy作为一个强大的数值计算库,提供了对多维数组的很多便捷操作。 承接上一篇数组的创建,本篇主要介绍一些数组的基本操作。 1. 子数组 首先介绍获取子数组的方法,提取已有数据的一部分来参与计算是比较常用的功能。 对于一维数组,提取子数组:arr[start:stop:step] start:从哪
阅读全文
摘要:NumPy(Numerical Python)是一个Python库,主要用于高效地处理多维数组和矩阵计算。它是科学计算领域中使用最广泛的一个库。 在NumPy中,数组是最核心的概念,用于存储和操作数据。 NumPy数组是一种多维数组对象,可以存储相同类型的元素,它支持高效的数学运算和线性代数操作。
阅读全文
摘要:pandas 基础内容的目录: 概述 pandas 主要功能和应用场景的介绍。 数据读取 数据读取是第一步,只有成功加载数据之后,后续的操作才有可能。 pandas 可以读取和导入各种数据格式的数据,如 CSV,Excel,JSON,SQL,HTML 等,不需要手动编写复杂的读取代码。 核心数据结构
阅读全文
摘要:在进行统计分析时,pandas提供了多种工具来帮助我们理解数据。 pandas提供了多个聚合函数,其中包括均值、标准差、最大值、最小值等等。 此外,pandas还可以进行基于列的统计分析,例如通过groupby()函数对数据进行聚合,并计算每组的统计分析结果。 除了基本的统计分析之外,pandas还
阅读全文
摘要:在pandas中,索引(index)是用于访问数据的关键。 它为数据提供了基于标签的访问能力,类似于字典,可以根据标签查找和访问数据。 而pandas的轴(axis)是指数据表中的一个维度,可以理解为表格中的行和列。 通过指定轴,我们可以对数据进行切片、筛选、聚合等操作。 下面简要介绍pandas的
阅读全文
摘要:时间序列数据是数据分析中一类常见且重要的数据。 它们按照时间顺序记录,通常是从某些现象的观察中收集的,比如经济指标、气象数据、股票价格、销售数据等等。 时间序列数据的特点是有规律地随着时间变化而变化,它们的变化趋势可以被分析和预测。时间序列分析是一种用于预测未来值或评估过去值的统计方法,常常被用于预
阅读全文