CJTARRR - 博客园

2021年7月23日

摘要： import json# 需要设置headers和准备payload数据# 构建payload_headerspayload_headers = {}payload_headers['origin'] = 'https://xxxx.com'payload_headers[ 'user-agent 阅读全文

posted @ 2021-07-23 19:02 CJTARRR 阅读(120) 评论(0) 推荐(0) 编辑

重写dupefilter以解决scrapy-redis和scrapy-splash冲突问题

摘要： from __future__ import absolute_importfrom copy import deepcopyfrom scrapy.utils.request import request_fingerprintfrom scrapy.utils.url import cano 阅读全文

posted @ 2021-07-23 18:56 CJTARRR 阅读(288) 评论(0) 推荐(0) 编辑

常用替换User-Agent

摘要： USER_AGENT_LIST = [ "Mozilla/5.0 (Macintosh; U; Intel Mac OS X 10_6_8; en-us) AppleWebKit/534.50 (KHTML, like Gecko) Version/5.1 Safari/534.50", "Mozi 阅读全文

posted @ 2021-07-23 18:50 CJTARRR 阅读(312) 评论(0) 推荐(0) 编辑

爬虫部署：scrapyd+gerapy

摘要： 1、安装scrapyd 服务端安装：pip install scrapyd 客户端安装:pip install scrapyd-client 2、启动scrapyd服务服务端建立一个deploy文件夹，cd到该文件夹中，执行sudo scrapyd或scrapyd。这时在服务端主机的6800端口打阅读全文

posted @ 2021-07-23 18:47 CJTARRR 阅读(88) 评论(0) 推荐(0) 编辑

通过selenium获得cookies(字典)

摘要： from selenium import webdriverbro = webdriver.Chrome()bro.get('https://www.baidu.com')# 这里获得的是包含cookie信息的字典们组成的列表cookies_dic_list = bro.get_cookies() 阅读全文

posted @ 2021-07-23 18:21 CJTARRR 阅读(167) 评论(0) 推荐(0) 编辑

2021年7月13日

利用airtest爬取app内容

摘要： 1、下载安装airtest airtest官网：https://airtest.netease.com/home/ 进入官网就可以看到下载按钮。下载完成后是一个压缩包，解压之后找到应用程序打开就可以开始使用。 2、下载安装手机模拟器（推荐雷电模拟器）这里的模拟器是当作手机使用，当然你可以通过连接阅读全文

posted @ 2021-07-13 23:16 CJTARRR 阅读(858) 评论(0) 推荐(0) 编辑

判断代理ip是否可用

摘要： from concurrent.futures import ThreadPoolExecutor, as_completedimport socket # 判断ip_port是否能够连接上def try_connection(ip_port): s = socket.socket() # 等待最大阅读全文

posted @ 2021-07-13 13:38 CJTARRR 阅读(233) 评论(0) 推荐(0) 编辑

解决selenium控制webdriver总是被网站检测的问题

摘要： 1、下载js文件进入https://github.com/CreditTone/goniub 下载压缩包，解压==》src==》main==》resources==》stealth.js 或者进入https://github.com/kingname/stealth.min.js 直接下载ste 阅读全文

posted @ 2021-07-13 13:35 CJTARRR 阅读(471) 评论(0) 推荐(0) 编辑

2021年7月6日

redis安装(ubuntu)

摘要： redis安装(ubuntu) 1、下载 wget https://download.redis.io/releases/redis-3.2.8.tar.gz 2、解压 tar -zxvf redis-3.2.8.tar.gz 3、复制，放到usr/local目录下 sudo mv .redis-3 阅读全文

posted @ 2021-07-06 16:37 CJTARRR 阅读(86) 评论(0) 推荐(0) 编辑

2021年5月29日

mongo数据库和用户的创建、删除操作

摘要： 1.mongo客户端创建用户终端输入： mongo # 打开客户端 use admin # 切换到admin数据库 db.createUser({user:"admin",pwd:"password",roles:["root"]}) # 创建管理员用户也可以在创建用户时，指定用户角色和其管理的阅读全文

posted @ 2021-05-29 23:55 CJTARRR 阅读(407) 评论(0) 推荐(0) 编辑