02 2020 档案

摘要:本文章作为我的一系列关于《利用python进行数据分析》的笔记的文章的索引。分为四部分。 第一部分:numpy基础,共六节: numpy基础--ndarray(一种多维数组对象):https://www.cnblogs.com/mrlayfolk/p/12245315.html numpy基础--通 阅读全文
posted @ 2020-02-29 18:18 zhengcixi 阅读(212) 评论(0) 推荐(0) 编辑
摘要:本文章作为我的其它一系列关于《python核心编程《第二版》》的笔记的文章索引。 第一章:Python-快速入门:https://www.cnblogs.com/mrlayfolk/p/12103516.html 第二章:本章节是介绍python的序列数据结构,共四节: Python数据类型-序列: 阅读全文
posted @ 2020-02-29 17:13 zhengcixi 阅读(238) 评论(0) 推荐(0) 编辑
摘要:之前使用过一种方法实现求集合间的并集,参考文章:https://www.cnblogs.com/mrlayfolk/p/12373532.html,这次使用另外一种方法实现,这种方法效率更高。 目的: 求多个集合之前的并集,例如:现有四个集合C1 = {11, 22, 13, 14}、C2 = {1 阅读全文
posted @ 2020-02-29 16:48 zhengcixi 阅读(4583) 评论(3) 推荐(0) 编辑
摘要:注:本代码主要是为了实现多个集合之间求并集时的辅助代码,简单的举个例子来说明代码的功能。 约定:例如{11: [2, 3]}表示数据11在集合2和集合3中都存在。 现有以下数据: d0 = {38: [2], 11: [2, 3], 22: [2, 3]} d1 = {11: [0, 0, 1, 3 阅读全文
posted @ 2020-02-29 16:25 zhengcixi 阅读(383) 评论(0) 推荐(0) 编辑
摘要:目的:求多个集合之前的并集,例如:现有四个集合C1 = {11, 22, 13, 14}、C2 = {11, 32, 23, 14, 35}、C3 = {11, 22, 38}、C4 = {11, 22, 33, 14, 55, 66},则它们之间的并集应该为: C1 & C2 & C3 = {11 阅读全文
posted @ 2020-02-27 18:13 zhengcixi 阅读(4138) 评论(0) 推荐(0) 编辑
摘要:目的:使用python的numpy、pandas、matplotlib库来分析成都二手房的房价信息。 原始数据来源:贝壳找房网站上的数据https://cd.ke.com/ershoufang 环境:win10 python 3.7.3 参考链接:入门Python数据分析最好的实战项目(一) 环境: 阅读全文
posted @ 2020-02-20 22:02 zhengcixi 阅读(2334) 评论(0) 推荐(0) 编辑
摘要:从贝壳网获取房价信息。 基本的步骤和我的这篇博文一样:https://www.cnblogs.com/mrlayfolk/p/12319414.html。不熟悉的可参考一下。 下面的代码是获取3000个样本的代码。 1 # encoding:utf-8 2 3 ''' 4 目的:从贝壳找房中爬取房价 阅读全文
posted @ 2020-02-18 22:09 zhengcixi 阅读(871) 评论(0) 推荐(0) 编辑
摘要:参考文档:https://weread.qq.com/web/reader/37132a705e2b2f37196c138k98f3284021498f137082c2e 说明:我才接触网络爬虫,在看《python网络爬虫入门到实践》一书时,作者写了个实例获取豆瓣电影TOP250的所有电影的电影名称 阅读全文
posted @ 2020-02-16 23:20 zhengcixi 阅读(876) 评论(0) 推荐(0) 编辑
摘要:这个脚本的重用是批量读取excel并获取每个excel的所有sheet名输出到一个文件中。 环境:python 3.7.3 1 # -*- coding:utf-8 -*- 2 3 ''' 4 本代码的目的是获取多个excl的sheet名,并输出到指定文件中 5 ''' 6 7 import sys 阅读全文
posted @ 2020-02-14 16:47 zhengcixi 阅读(4360) 评论(0) 推荐(0) 编辑
摘要:本章先介绍向网络服务器发送GET请求以获取具体网页,再从网页中读取HTML内容,最后做一些简单的信息提取,将我们要寻找的内容分离出来。 注:本节用到的html文件就是书中的,可以通过url访问到。 1.1 网络连接 1 from urllib.request import urlopen 2 htm 阅读全文
posted @ 2020-02-09 20:00 zhengcixi 阅读(241) 评论(0) 推荐(0) 编辑
摘要:本节pandas库会用到,约定:import pandas as pd numpy库也会用到,约定:import numpy as np 3 日期范围、频率、移动 pandas中的时间序列一般被认为是不规则的,也就是说没有固定的频率。但pandas有一整套标准时间序列频率以及用于重采样、频率推断、生 阅读全文
posted @ 2020-02-06 14:04 zhengcixi 阅读(1537) 评论(0) 推荐(0) 编辑
摘要:本节pandas库会用到,约定:import pandas as pd numpy库也会用到,约定:import numpy as np 2 时间序列基础 pandas最基本的时间序列类型就是以时间戳(通常以python字符串或datetime对象表示)为索引的Series。 1 >>> from 阅读全文
posted @ 2020-02-06 13:34 zhengcixi 阅读(475) 评论(0) 推荐(0) 编辑
摘要:1 时间序列-日期和时间数据类型 时间序列(time series)数据是一种重要的结构化数据形式,在多个时间点观察或测量到得任何事物都可以形成一段时间序列,很多时间序列是固定频率的。也就是说,数据点是根据某种规律定期出现的(比如15s、5min、1month)。时间序列也可以是不定期的。 时间序列 阅读全文
posted @ 2020-02-06 13:28 zhengcixi 阅读(1598) 评论(0) 推荐(0) 编辑
摘要:matplotlib API函数都位于matplotlib.pyplot模块中。 本节代码中引入的约定为:import matplotlib.pyplot as plt numpy库也会用到,约定:import numpy as np pandas库也会用到,约定:import pandas as 阅读全文
posted @ 2020-02-04 15:22 zhengcixi 阅读(1246) 评论(0) 推荐(0) 编辑
摘要:matplotlib API函数都位于matplotlib.pyplot模块中。 本节代码中引入的约定为:import matplotlib.pyplot as plt 另外,numpy库也会用到,约定:import numpy as np 1 matplotlib API入门 官方文档:Users 阅读全文
posted @ 2020-02-04 11:55 zhengcixi 阅读(686) 评论(0) 推荐(0) 编辑
摘要:pandas含有是数据分析工作变得更快更简单的高级数据结构和操作工具,是基于numpy构建的。 本章节的代码引入pandas约定为:import pandas as pd,另外import numpy as np也会用到。 官方介绍:pandas - Python Data Analysis Lib 阅读全文
posted @ 2020-02-03 17:32 zhengcixi 阅读(555) 评论(0) 推荐(0) 编辑
摘要:pandas含有是数据分析工作变得更快更简单的高级数据结构和操作工具,是基于numpy构建的。 本章节的代码引入pandas约定为:import pandas as pd,另外import numpy as np也会用到。 官方介绍:pandas - Python Data Analysis Lib 阅读全文
posted @ 2020-02-03 17:26 zhengcixi 阅读(619) 评论(0) 推荐(0) 编辑
摘要:pandas含有是数据分析工作变得更快更简单的高级数据结构和操作工具,是基于numpy构建的。 本章节的代码引入pandas约定为:import pandas as pd,另外import numpy as np也会用到。 官方介绍:pandas - Python Data Analysis Lib 阅读全文
posted @ 2020-02-03 17:21 zhengcixi 阅读(563) 评论(0) 推荐(0) 编辑
摘要:pandas含有是数据分析工作变得更快更简单的高级数据结构和操作工具,是基于numpy构建的。 本章节的代码引入pandas约定为:import pandas as pd,另外import numpy as np也会用到。 官方介绍:pandas - Python Data Analysis Lib 阅读全文
posted @ 2020-02-03 00:07 zhengcixi 阅读(319) 评论(0) 推荐(0) 编辑
摘要:本文简单的说一下自己对pandas的rank()函数的简单讲解。 函数原型:rank(axis=0, method: str = 'average', numeric_only: Union[bool, NoneType] = None, na_option: str = 'keep', ascen 阅读全文
posted @ 2020-02-02 23:27 zhengcixi 阅读(8922) 评论(0) 推荐(1) 编辑
摘要:pandas含有是数据分析工作变得更快更简单的高级数据结构和操作工具,是基于numpy构建的。 本章节的代码引入pandas约定为:import pandas as pd,另外import numpy as np也会用到。 官方介绍:pandas - Python Data Analysis Lib 阅读全文
posted @ 2020-02-02 15:57 zhengcixi 阅读(494) 评论(0) 推荐(0) 编辑
摘要:从本文开始介绍pandas的相关知识。 pandas含有是数据分析工作变得更快更简单的高级数据结构和操作工具,是基于numpy构建的。 本章节的代码引入pandas约定为:import pandas as pd,另外import numpy as np也会用到。 官方介绍:pandas - Pyth 阅读全文
posted @ 2020-02-02 15:32 zhengcixi 阅读(493) 评论(0) 推荐(0) 编辑
摘要:从本文开始介绍pandas的相关知识。 pandas含有是数据分析工作变得更快更简单的高级数据结构和操作工具,是基于numpy构建的。 本章节的代码引入pandas约定为:import pandas as pd,另外import numpy as np也会用到。 官方介绍:pandas - Pyth 阅读全文
posted @ 2020-02-02 14:09 zhengcixi 阅读(775) 评论(0) 推荐(0) 编辑
摘要:函数原型:numpy.cumsum(a, axis=None, dtype=None, out=None) 可参考链接:https://docs.scipy.org/doc/numpy-1.10.1/reference/generated/numpy.cumsum.html查看各个参数的含义。 函数 阅读全文
posted @ 2020-02-02 12:26 zhengcixi 阅读(6539) 评论(2) 推荐(0) 编辑
摘要:以下代码的前提:import numpy as np numpy.random模块对python内置的random进行了补充,增加了一些高效生成多种概率分布的样本值的函数。例如可以用normal来得到一个正态分布的样本数组。 1 >>> samples = np.random.normal(size 阅读全文
posted @ 2020-02-01 16:57 zhengcixi 阅读(539) 评论(0) 推荐(0) 编辑
摘要:以下代码的前提:import numpy as np 线性代数(如矩阵乘法、矩阵分解、行列式以及其他方阵数学等)是任何数组库的重要组成部分。numpy提供了一个用于矩阵乘法的dot函数(既是一个数组方法也是numpy命名空间中的一个函数)。 矩阵乘法官方说明:numpy.dot — NumPy v1 阅读全文
posted @ 2020-02-01 16:56 zhengcixi 阅读(230) 评论(0) 推荐(0) 编辑
摘要:以下代码的前提:import numpy as np numpy能够读写磁盘上的文本数据或二进制数据。 1 将数组以二进制格式保存到磁盘 np.save和np.load是读写磁盘数组数据的两个主要函数。默认情况下,数组是以未压缩的原始二进制格式保存在扩展名为.npy的文件中的。 通过np.savez 阅读全文
posted @ 2020-02-01 16:52 zhengcixi 阅读(235) 评论(0) 推荐(0) 编辑
摘要:以下代码的前提:import numpy as np numpy数组可以将许多种数据处理任务表述为简洁的数组表达式,用数组表达式替换循环的做法,通常被称为矢量化。 官方说明文档:Array creation routines — NumPy v1.21 Manual 例如:我们想要处理一组值(网格型 阅读全文
posted @ 2020-02-01 15:30 zhengcixi 阅读(357) 评论(0) 推荐(0) 编辑
摘要:以下代码的前提:import numpy as np 通用函数(即ufunc)是一种对narray中的数组执行元素级运算的函数。可以看作简单函数(接受一个或多个标量值,并产生一个或多个标量值)的矢量化包装器。 官方说明文档:Universal functions (ufunc) — NumPy v1 阅读全文
posted @ 2020-02-01 11:01 zhengcixi 阅读(434) 评论(0) 推荐(0) 编辑

回到顶部
点击右上角即可分享
微信分享提示