摘要:
第二章:NumPy基础 1、数组对象ndarray 2、数组数据类型 3、NumPy生成伪随机数 4、数组的访问与形态变换 5、使用函数进行简单统计分析 6、通用函数ufunc的运算 7、用于数组的文件输入输出 第1节:数组对象ndarray 1、什么是ndarray 一种存储单一数据类型的多维数组 阅读全文
摘要:
第一章Python数据分析概述 1、理解数据 2、认识数据分析 3、数据分析工具Python 4、重要的Python数据分析类库 5、集成开发环境和文本编辑器 6、使用Jupyter Notebook 第1节:理解数据 1、数据有结构化数据、半结构化数据和非结构化数据 结构化数据有: 1、表格型数据 阅读全文
摘要:
一、创建项目 二、更改设置(setting等) 三、编码 1 # -*- coding: utf-8 -*- 2 import scrapy 3 4 5 class RenrenSpider(scrapy.Spider): 6 name = 'renren' 7 allowed_domains = 阅读全文
摘要:
CrawlSpider可用于有规则的网站,对其整站的爬取 一、创建项目 scrapy startproject wxapp cd wxapp scrapy genspider -t crawl wxapp_spider wxapp-union.com 二、更改setting.py ROBOTSTXT 阅读全文
摘要:
开始参考https://www.cnblogs.com/sruzzg/p/13060159.html 一、创建scrapy爬虫工程demo scrapy startproject demo 快捷创建了一个demo新工程 二、在工程中生成一个scrapy爬虫qiushibaike 1:进入工程 cd 阅读全文
摘要:
滑块验证 OpenCV+python https://www.jb51.net/article/161503.htm?tdsourcetag=s_pcqq_aiomsg python+selenium... https://www.cnblogs.com/ohahastudy/p/11493971. 阅读全文
摘要:
一、简单验证码识别处理 1 """""" 2 3 4 import pytesseract 5 from PIL import Image 6 from urllib import request 7 import time 8 9 def main(): 10 # 这个url也可以通过登录页面分析 阅读全文
摘要:
1、 安装tesseract OCR,即Optical Character Recognition,光学字符识别,是指通过扫描字符,然后通过其形状将其翻译成电子文本的过程。对于图形验证码来说,它们都是一些不规则的字符,这些字符确实是由字符稍加扭曲变换得到的内容。 tesseract下载地址: 链接: 阅读全文