上一页 1 ··· 11 12 13 14 15 16 17 18 19 ··· 21 下一页
摘要: 从贝壳网获取房价信息。 基本的步骤和我的这篇博文一样:https://www.cnblogs.com/mrlayfolk/p/12319414.html。不熟悉的可参考一下。 下面的代码是获取3000个样本的代码。 1 # encoding:utf-8 2 3 ''' 4 目的:从贝壳找房中爬取房价 阅读全文
posted @ 2020-02-18 22:09 zhengcixi 阅读(867) 评论(0) 推荐(0) 编辑
摘要: 参考文档:https://weread.qq.com/web/reader/37132a705e2b2f37196c138k98f3284021498f137082c2e 说明:我才接触网络爬虫,在看《python网络爬虫入门到实践》一书时,作者写了个实例获取豆瓣电影TOP250的所有电影的电影名称 阅读全文
posted @ 2020-02-16 23:20 zhengcixi 阅读(869) 评论(0) 推荐(0) 编辑
摘要: 这个脚本的重用是批量读取excel并获取每个excel的所有sheet名输出到一个文件中。 环境:python 3.7.3 1 # -*- coding:utf-8 -*- 2 3 ''' 4 本代码的目的是获取多个excl的sheet名,并输出到指定文件中 5 ''' 6 7 import sys 阅读全文
posted @ 2020-02-14 16:47 zhengcixi 阅读(4349) 评论(0) 推荐(0) 编辑
摘要: 本章先介绍向网络服务器发送GET请求以获取具体网页,再从网页中读取HTML内容,最后做一些简单的信息提取,将我们要寻找的内容分离出来。 注:本节用到的html文件就是书中的,可以通过url访问到。 1.1 网络连接 1 from urllib.request import urlopen 2 htm 阅读全文
posted @ 2020-02-09 20:00 zhengcixi 阅读(240) 评论(0) 推荐(0) 编辑
摘要: 本节pandas库会用到,约定:import pandas as pd numpy库也会用到,约定:import numpy as np 3 日期范围、频率、移动 pandas中的时间序列一般被认为是不规则的,也就是说没有固定的频率。但pandas有一整套标准时间序列频率以及用于重采样、频率推断、生 阅读全文
posted @ 2020-02-06 14:04 zhengcixi 阅读(1497) 评论(0) 推荐(0) 编辑
摘要: 本节pandas库会用到,约定:import pandas as pd numpy库也会用到,约定:import numpy as np 2 时间序列基础 pandas最基本的时间序列类型就是以时间戳(通常以python字符串或datetime对象表示)为索引的Series。 1 >>> from 阅读全文
posted @ 2020-02-06 13:34 zhengcixi 阅读(467) 评论(0) 推荐(0) 编辑
摘要: 1 时间序列-日期和时间数据类型 时间序列(time series)数据是一种重要的结构化数据形式,在多个时间点观察或测量到得任何事物都可以形成一段时间序列,很多时间序列是固定频率的。也就是说,数据点是根据某种规律定期出现的(比如15s、5min、1month)。时间序列也可以是不定期的。 时间序列 阅读全文
posted @ 2020-02-06 13:28 zhengcixi 阅读(1549) 评论(0) 推荐(0) 编辑
摘要: matplotlib API函数都位于matplotlib.pyplot模块中。 本节代码中引入的约定为:import matplotlib.pyplot as plt numpy库也会用到,约定:import numpy as np pandas库也会用到,约定:import pandas as 阅读全文
posted @ 2020-02-04 15:22 zhengcixi 阅读(1215) 评论(0) 推荐(0) 编辑
摘要: matplotlib API函数都位于matplotlib.pyplot模块中。 本节代码中引入的约定为:import matplotlib.pyplot as plt 另外,numpy库也会用到,约定:import numpy as np 1 matplotlib API入门 官方文档:Users 阅读全文
posted @ 2020-02-04 11:55 zhengcixi 阅读(676) 评论(0) 推荐(0) 编辑
摘要: pandas含有是数据分析工作变得更快更简单的高级数据结构和操作工具,是基于numpy构建的。 本章节的代码引入pandas约定为:import pandas as pd,另外import numpy as np也会用到。 官方介绍:pandas - Python Data Analysis Lib 阅读全文
posted @ 2020-02-03 17:32 zhengcixi 阅读(550) 评论(0) 推荐(0) 编辑
上一页 1 ··· 11 12 13 14 15 16 17 18 19 ··· 21 下一页
回到顶部