随笔- 80 文章- 0 评论- 16 阅读- 26万

04 2019 档案

摘要：1.Scrapy框架简介 1.1 Scrapy框架介绍写一个爬虫，需要做很多的事情。比如：发送网络请求、数据解析、数据存储、反反爬虫机制（更换ip代理、设置请求头等）、异步请求等。这些工作如果每次都要自己从零开始写的话，比较浪费时间。因此Scrapy把一些基础的东西封装好了，在他上面写爬虫可以变的阅读全文

posted @ 2019-04-09 14:23 enjoyzier 阅读(594) 评论(0) 推荐(0) 编辑

爬虫之图形验证码识别技术

摘要：>>>>>>待续阅读全文

posted @ 2019-04-08 17:51 enjoyzier 阅读(196) 评论(0) 推荐(0) 编辑

selenium抓取动态网页数据

摘要：1.selenium抓取动态网页数据基础介绍 1.1 什么是AJAX AJAX（Asynchronouse JavaScript And XML：异步JavaScript和XML）通过在后台与服务器进行少量数据交换，Ajax 可以使网页实现异步更新，这意味着可以在不重新加载整个网页的情况下，对网页的阅读全文

posted @ 2019-04-04 15:17 enjoyzier 阅读(3110) 评论(1) 推荐(0) 编辑

爬虫之多线程、异步

摘要：1.使用传统方式爬取“斗图啦”网站的图片 #-*-coding = utf-8 -*- import requests from lxml import etree import re import os.path from urllib import request def parse_page( 阅读全文

posted @ 2019-04-03 13:01 enjoyzier 阅读(431) 评论(0) 推荐(0) 编辑

公告

昵称： enjoyzier
园龄： 7年6个月
粉丝： 47
关注： 0

+加关注

2025年3月

日

一

二

三

四

五

六

enjoyzier

04 2019 档案

公告

搜索

常用链接

积分与排名

随笔分类

随笔档案

阅读排行榜

评论排行榜

推荐排行榜

最新评论