百里屠苏top |
|
||
2020年1月13日
摘要:
由上一节内容可知,matplotlib 实际上是一种比较低级的工具。要组装一张图表,得用它的各种基础组件才行。 pandas 有许多能够利用DataFrame 对象数据组织特点来创建标准图表的高级绘图方法。 1. 线型图 Series 和 DataFrame 都有一个用于生成各类图表的plot 方法 阅读全文
摘要:
8. 绘图和可视化——matplotlib 首先确定IPython 是以Pylab 模式启动的。 在命令行窗口(CMD窗口)输入 ipython --pylab 或者在ipython 环境下输入%pylab 绘制一条直线: 8.1 Figure和Subplot matplotlib 的图像都位于Fi 阅读全文
2020年1月12日
摘要:
6. 数据加载、存储和文件格式 输出输出通常包括几个大类: 读取文本文件和其他更高效的磁盘存储格式; 加载数据库中的数据; 利用Web API 操作网络资源。 这里着重介绍pandas的输入输出对象。 6.1 读取文本格式的数据 pandas 提供了一些用于将表格数据读取为DataFrame 对象的 阅读全文
摘要:
pandas 入门: pandas 含有使数据分析工作变得更快更简单的高级数据结构和操作工具。pandas 是基于Numpy 构建的。 导入pandas包: from pandas import Series , DataFrame import pandas as pd pandas 的数据结构介 阅读全文
摘要:
Numpy 基础 :数组和矢量计算 Numpy 是高性能科学计算和数据分析的基础包。部分功能如下: ndarray,一个具有矢量算数运算和复杂广播能力的快速且节省空间的多维数组。 对数组数据进行快速运算(无需编写循环) 读写磁盘数据、操作内存映射文件。 线性代数、随机数生成,傅里叶变换。 集成由C/ 阅读全文
2020年1月11日
摘要:
高效处理数据的Python工具基本可以完成以下几个大类的任务: 与外界进行交互: 读写各式各样的文件格式和数据库。 准备: 对数据进行清理、修整、整合、规范化、重塑、切片切块、变形等以便进行分析。 转换: 建模和计算: 展示: IPython介绍 ipython是一个python的交互式shell, 阅读全文
2019年12月26日
摘要:
1.术语 scripting 脚本 scientific computing 科学计算 2.为什么不选Python Python 是一种解释型编程语言,因此大部分pytnon 代码都要比用编译型语言(如 java 和 C++ )编写的代码运行慢的多。 由于程序员的时间要比CPU时间值钱。 3.几个重 阅读全文
2019年10月22日
摘要:
前面介绍了爬取web 网页的内容,随着移动互联网的发展,越来越多的企业直接开发了APP,更多更全的信息都是通过App来展示的。 APP的爬取相比web 端爬取更容易一些,反爬虫能力没有那么强,而且数据大多数是以JSON 形式传输的,解析更加简单。 在web端,我们是通过浏览器的开发者工具监听各个网络 阅读全文
2019年10月20日
摘要:
很多情况下,页面的某些信息需要登录才可以查看。 这里的核心是获取登陆之后的 Cookies 。话不多说,操练起来。 1. 模拟登录并爬取GitHub 1.1 环境准备 requests库 lxml库 1.2 分析登录过程 打开Github的登录页面,https://github.com/login. 阅读全文
2019年10月16日
摘要:
安装Redis 数据库并启动服务 Windows下安装: 下载地址:https://github.com/MSOpenTech/redis/releases 下载之后解压目录如下: 修改redis.windows.conf文件,设置maxmemory 大小 : 设置redis密码 : 启动redis 阅读全文
|
Copyright © 2024 百里屠苏top
Powered by .NET 9.0 on Kubernetes |