02 2018 档案
摘要:申明:本系列文章是自己在学习《利用Python进行数据分析》这本书的过程中,为了方便后期自己巩固知识而整理。 我们来汇总一下成绩: 然后,我们再进行汇总统计: 当然,还有别的统计法则: idxmin 最小值的索引值 idxmax 最大值的索引值 describe 一次性 多种维度统计 count 非
阅读全文
摘要:申明:本系列文章是自己在学习《利用Python进行数据分析》这本书的过程中,为了方便后期自己巩固知识而整理。 第一 重新索引 Series的reindex方法 新索引值当前值缺失,则需要插值 前向值填充method=’ffill’,最后索引j对应的值来填充 前向值搬运method=’pad’,最后索
阅读全文
摘要:申明:本系列文章是自己在学习《利用Python进行数据分析》这本书的过程中,为了方便后期自己巩固知识而整理。 首先,需要导入pandas库的Series和DataFrame Series 是一种类似一维数组的对象,是一组数据与索引的组合。如果没设置索引,默认会加上。 自定义索引 获取values和i
阅读全文
摘要:通用函数:快速的元素级数组函数 通用函数,是指对数组中的数据执行元素级运算的函数:接受一个或多个标量值,并产生一个或多个标量值。 sqrt 求平方根 exp 计算各元素指数 一元函数 二元函数
阅读全文
摘要:Numpy数据类型包括: int8、uint8、int16、uint16、int32、uint32、int64、uint64、float16、float32、float64、float128、complex64、complex128、complex256、bool、object、string_、un
阅读全文
摘要:ndarray:多维数组ndarray 每个数组元素必须是相同类型,每个数组都有shape和dtype对象。shape 表示数组大小dtype 表示数组数据类型array如何创建一个数组?In[1]:import numpy as npIn[2]:data = [1,2,3,4,5,6,7]In[3]:arr = np.array(data)In[3]:arrOut[3]:array([1,2,3...
阅读全文
摘要:#python3.4+selenium3.5+chrome版本 63.0.3239.132+chrome驱动chromedriver.exe #实现自动登录百度 from selenium import webdriver from time import sleep #新建webdriver对象 driver = webdriver.Chrome() driver.maximize_wind...
阅读全文
摘要:将图像翻译成文字一般被称为光学文字识别(Optical Character Recognition,OCR) OCR库:Pillow、Tesseract、NumPy Pillow Pillow可以对图片进行预处理,比如图片背景色不是纯白,而是渐进色,那么就可以利用Pillow进行预处理得到相对清晰的
阅读全文
摘要:在Scrapy里面,Selectors 有四种基础的方法xpath():返回一系列的selectors,每一个select表示一个xpath参数表达式选择的节点css():返回一系列的selectors,每一个select表示一个css参数表达式选择的节点extract():返回一个unicode字
阅读全文
摘要:开始的时候,我只安装了python3.5,安装不了scrapy库,网上搜了一下说是scrapy不支持python3.x 然后,我就又安装了python2.7 为了,默认使用2.7,我在环境变量path中添加下面2项: 接着,我在E:\PycharmProjects目录下按住Shift键右击,选择“在
阅读全文
摘要:from selenium import webdriverimport timefrom bs4 import BeautifulSoupfrom urllib import requestimport urlliburl = "http://www.hsbkos.com/"re = urllib.request.urlopen(url)response = (re)content = res...
阅读全文
摘要:先安装python 3.x 然后 cmd 执行 pip3 ipython 然后 cmd 执行 pip3 install jupyter notebook 然后 cmd 执行 jupyter notebook 修改端口 cmd 执行 jupyter notebook --port 9999
阅读全文