随笔分类 - python爬虫

Scrapy 框架

摘要：一、Scrapy 安装二、Scrapy命令介绍三、创建项目阅读全文

posted @ 2018-11-30 20:46 巽逸阅读(145) 评论(0) 推荐(0) 编辑

摘要：import requests import queue import threading from lxml import etree #要爬取的URL url = "http://xxxxx" #代理ip网站 proxy_url = "https://www.kuaidaili.com/free/inha/{page}/" class MyThreadPool: def __i... 阅读全文

posted @ 2018-11-29 10:38 巽逸阅读(452) 评论(0) 推荐(0) 编辑

selenium模块

摘要：一、selenium介绍 selenium最初是一个测试工具，而爬虫中使用它主要是为了解决requests无法直接执行JavaScript代码的问题 selenium本质是通过驱动浏览器，完全模拟浏览器的操作，比如跳转、输入、点击、下拉等，来拿到网页渲染之后的结果，可支持多种浏览器二、seleni 阅读全文

posted @ 2018-08-21 16:12 巽逸阅读(178) 评论(0) 推荐(0) 编辑

公告

昵称：巽逸
园龄： 7年5个月
粉丝： 19
关注： 7

+加关注

2025年3月

日

一

二

三

四

五

六

巽逸

随笔分类 - python爬虫

公告

搜索

常用链接

我的标签

随笔分类

随笔档案

文章分类

阅读排行榜

评论排行榜

推荐排行榜

最新评论