2020年7月3日

第11章 时间序列

摘要: 时间序列(time series)数据是一种重要的结构化数据形式,应用于多个领域,包括金融学、经济学、生态学、神经科学、物理学等。在多个时间点观察或测量到的任何事物都可以形成一段时间序列。很多时间序列是固定频率的,也就是说,数据点是根据某种规律定期出现的(比如每15秒、每5分钟、每月出现一次)。时间序列也可以是不定期的,没有固定的时间单位或单位之间的偏移量。时间序列数据的意义取决于具体的应用场景,... 阅读全文

posted @ 2020-07-03 00:02 pencil2001 阅读(290) 评论(0) 推荐(0)

第12章 pandas高级应用

摘要: 前面的章节关注于不同类型的数据规整流程和NumPy、pandas与其它库的特点。随着时间的发展,pandas发展出了更多适合高级用户的功能。本章就要深入学习pandas的高级功能。12.1 分类数据这一节介绍的是pandas的分类类型。我会向你展示通过使用它,提高性能和内存的使用率。我还会介绍一些在统计和机器学习中使用分类数据的工具。背景和目的表中的一列通常会有重复的包含不同值的小集合的情况。我们... 阅读全文

posted @ 2020-07-03 00:01 pencil2001 阅读(224) 评论(0) 推荐(0)

第13章 Python建模库介绍

摘要: 本书中,我已经介绍了Python数据分析的编程基础。因为数据分析师和科学家总是在数据规整和准备上花费大量时间,这本书的重点在于掌握这些功能。开发模型选用什么库取决于应用本身。许多统计问题可以用简单方法解决,比如普通的最小二乘回归,其它问题可能需要复杂的机器学习方法。幸运的是,Python已经成为了运用这些分析方法的语言之一,因此读完此书,你可以探索许多工具。本章中,我会回顾一些pandas的特点,... 阅读全文

posted @ 2020-07-03 00:00 pencil2001 阅读(362) 评论(0) 推荐(0)

2020年7月2日

第14章 数据分析案例

摘要: 本书正文的最后一章,我们来看一些真实世界的数据集。对于每个数据集,我们会用之前介绍的方法,从原始数据中提取有意义的内容。展示的方法适用于其它数据集,也包括你的。本章包含了一些各种各样的案例数据集,可以用来练习。案例数据集可以在Github仓库找到,见第一章。14.1 来自Bitly的USA.gov数据2011年,URL缩短服务Bitly跟美国政府网站USA.gov合作,提供了一份从生成.gov或.... 阅读全文

posted @ 2020-07-02 23:59 pencil2001 阅读(708) 评论(0) 推荐(0)

附录A NumPy高级应用

摘要: 在这篇附录中,我会深入NumPy库的数组计算。这会包括ndarray更内部的细节,和更高级的数组操作和算法。本章包括了一些杂乱的章节,不需要仔细研究。A.1 ndarray对象的内部机理NumPy的ndarray提供了一种将同质数据块(可以是连续或跨越)解释为多维数组对象的方式。正如你之前所看到的那样,数据类型(dtype)决定了数据的解释方式,比如浮点数、整数、布尔值等。ndarray如此强大的... 阅读全文

posted @ 2020-07-02 23:58 pencil2001 阅读(217) 评论(0) 推荐(0)

附录B 更多关于IPython的内容(完)

摘要: 第2章中,我们学习了IPython shell和Jupyter notebook的基础。本章中,我们会探索IPython更深层次的功能,可以从控制台或在jupyter使用。B.1 使用命令历史Ipython维护了一个位于磁盘的小型数据库,用于保存执行的每条指令。它的用途有:只用最少的输入,就能搜索、补全和执行先前运行过的指令;在不同session间保存命令历史;将日志输入/输出历史到一个文件这些功... 阅读全文

posted @ 2020-07-02 23:57 pencil2001 阅读(133) 评论(0) 推荐(0)

Pytho基础

摘要: 小技巧: 1、python安装目录:在dos界面命令行输入:where python,可返回本机的python的安装路径。 2、C:\Users\Administrator>python --version 或者python -V 查看python版本 3、print('Hello', end='' 阅读全文

posted @ 2020-07-02 18:10 pencil2001 阅读(327) 评论(0) 推荐(0)

2020年6月27日

Pandas 速查手册

摘要: Pandas 是一个强大的分析结构化数据的工具集,它的使用基础是 Numpy(提供高性能的矩阵运算),用于数据挖掘和数据分析,同时也提供数据清洗功能。 本页收集了 Python 数据分析库 Pandas 及相关工具的日常使用方法,备查,持续更新中。 缩写说明: df:任意的 Pandas DataF 阅读全文

posted @ 2020-06-27 19:46 pencil2001 阅读(624) 评论(0) 推荐(0)

python-examples

摘要: 主要章节和小节重新按照如下逻辑划分: 一、Python基础 1 数字 2 字符串 3 列表 4 流程控制 5 编程风格 6 函数 7 输入和输出 8 数据结构 9 模块 10 错误和异常 11 类和对象 二、Python模块 1 时间模块 2 文件操作 3 常见迭代器 4 yield 用法 5 装饰 阅读全文

posted @ 2020-06-27 09:06 pencil2001 阅读(1235) 评论(0) 推荐(0)

图像的数组表示

摘要: from PIL import Imageimport numpy as npimport numpy.core.numeric as _nximport matplotlib.pyplot as pltimage_name = 'Lenna_(test_image).png'image_name_ 阅读全文

posted @ 2020-06-27 07:44 pencil2001 阅读(488) 评论(0) 推荐(0)

导航