摘要: 第二章:NumPy基础 1、数组对象ndarray 2、数组数据类型 3、NumPy生成伪随机数 4、数组的访问与形态变换 5、使用函数进行简单统计分析 6、通用函数ufunc的运算 7、用于数组的文件输入输出 第1节:数组对象ndarray 1、什么是ndarray 一种存储单一数据类型的多维数组 阅读全文
posted @ 2020-07-12 21:06 udbful 阅读(474) 评论(0) 推荐(0) 编辑
摘要: 第一章Python数据分析概述 1、理解数据 2、认识数据分析 3、数据分析工具Python 4、重要的Python数据分析类库 5、集成开发环境和文本编辑器 6、使用Jupyter Notebook 第1节:理解数据 1、数据有结构化数据、半结构化数据和非结构化数据 结构化数据有: 1、表格型数据 阅读全文
posted @ 2020-07-11 23:39 udbful 阅读(524) 评论(0) 推荐(0) 编辑
摘要: 一、创建项目 二、更改设置(setting等) 三、编码 1 # -*- coding: utf-8 -*- 2 import scrapy 3 4 5 class RenrenSpider(scrapy.Spider): 6 name = 'renren' 7 allowed_domains = 阅读全文
posted @ 2020-06-28 17:33 udbful 阅读(160) 评论(0) 推荐(0) 编辑
摘要: 阅读全文
posted @ 2020-06-25 01:00 udbful 阅读(97) 评论(0) 推荐(0) 编辑
摘要: 工 阅读全文
posted @ 2020-06-25 00:58 udbful 阅读(69) 评论(0) 推荐(0) 编辑
摘要: CrawlSpider可用于有规则的网站,对其整站的爬取 一、创建项目 scrapy startproject wxapp cd wxapp scrapy genspider -t crawl wxapp_spider wxapp-union.com 二、更改setting.py ROBOTSTXT 阅读全文
posted @ 2020-06-24 09:48 udbful 阅读(284) 评论(0) 推荐(0) 编辑
摘要: 开始参考https://www.cnblogs.com/sruzzg/p/13060159.html 一、创建scrapy爬虫工程demo scrapy startproject demo 快捷创建了一个demo新工程 二、在工程中生成一个scrapy爬虫qiushibaike 1:进入工程 cd 阅读全文
posted @ 2020-06-23 22:05 udbful 阅读(221) 评论(0) 推荐(0) 编辑
摘要: 滑块验证 OpenCV+python https://www.jb51.net/article/161503.htm?tdsourcetag=s_pcqq_aiomsg python+selenium... https://www.cnblogs.com/ohahastudy/p/11493971. 阅读全文
posted @ 2020-06-22 16:53 udbful 阅读(127) 评论(0) 推荐(0) 编辑
摘要: 一、简单验证码识别处理 1 """""" 2 3 4 import pytesseract 5 from PIL import Image 6 from urllib import request 7 import time 8 9 def main(): 10 # 这个url也可以通过登录页面分析 阅读全文
posted @ 2020-06-22 15:05 udbful 阅读(175) 评论(0) 推荐(0) 编辑
摘要: 1、 安装tesseract OCR,即Optical Character Recognition,光学字符识别,是指通过扫描字符,然后通过其形状将其翻译成电子文本的过程。对于图形验证码来说,它们都是一些不规则的字符,这些字符确实是由字符稍加扭曲变换得到的内容。 tesseract下载地址: 链接: 阅读全文
posted @ 2020-06-22 10:50 udbful 阅读(1087) 评论(0) 推荐(0) 编辑