摘要: 上图是发送告警的截图 grafana 监控mysql的图片 需要部署5个容器 docker run -d -p 9104:9104 --network mysql-network --name mysql-exporter -e DATA_SOURCE_NAME="root:123456@(192. 阅读全文
posted @ 2021-08-04 15:58 zhong_sp 阅读(327) 评论(0) 推荐(0) 编辑
摘要: 随着现在对数据的重视程度越来越高,现在各大网站都加强了反爬技术,比如本文中js加密 url地址:https://www.huanhuanhuishou.com/gujia/22201.html 需要爬取的数据是最高的回收价格:14760 经过分析这个数据是ajax发送请求getEvaluateDat 阅读全文
posted @ 2019-04-23 11:54 zhong_sp 阅读(429) 评论(0) 推荐(0) 编辑
摘要: mitmproxy 是一个中间件代理, 结合python使用 安装 pip install mitmproxy 在windows上没有mitmproxy 所以只要用mitmdump和mitmwdb 初次使用的时候要去mitm.it 安装对应系统的证书 如果在windows上的谷歌浏览器访问https 阅读全文
posted @ 2019-01-25 10:35 zhong_sp 阅读(3903) 评论(0) 推荐(0) 编辑
摘要: 在工作中会碰到这样的一个需求,mapping中定义的类型是nested 如果想要对fullJudgement.opponentLawyers.name查询二次就需要下面的查询语句 阅读全文
posted @ 2019-01-16 10:57 zhong_sp 阅读(746) 评论(0) 推荐(0) 编辑
摘要: 1 import asyncio 2 import aiohttp 3 import async_timeout 4 from lxml import html 5 from timeit import default_timer as timer 6 7 from db import DBData 阅读全文
posted @ 2018-12-25 10:29 zhong_sp 阅读(348) 评论(0) 推荐(0) 编辑
摘要: 1 import aiohttp 2 import asyncio 3 import async_timeout 4 from urllib.parse import urljoin,urldefrag 5 6 root_url = 'http://python/org/' # 开始的url 7 c 阅读全文
posted @ 2018-12-25 10:08 zhong_sp 阅读(335) 评论(0) 推荐(0) 编辑
摘要: 从各个城市的律师协会去爬取的律师的招聘信息,可是邮箱在招聘简介里面,所有需要写个脚本去提取邮箱 阅读全文
posted @ 2018-11-28 14:13 zhong_sp 阅读(603) 评论(0) 推荐(0) 编辑
摘要: 如果爬虫在服务器中持续运行,那么日志都会写入到一个文件中,这样不方便管理日志 在custom_settings 中配置了爬虫日志的生成, 以下是删除旧的日志的代码 阅读全文
posted @ 2018-10-20 11:34 zhong_sp 阅读(824) 评论(0) 推荐(0) 编辑
摘要: 首先解决爬虫等待,不被关闭的问题: 1、scrapy内部的信号系统会在爬虫耗尽内部队列中的request时,就会触发spider_idle信号。 2、爬虫的信号管理器收到spider_idle信号后,将调用注册spider_idle信号的处理器进行处理。 3、当该信号的所有处理器(handler)被 阅读全文
posted @ 2018-10-20 10:53 zhong_sp 阅读(1068) 评论(0) 推荐(0) 编辑
摘要: # Python 资源大全中文版 我想很多程序员应该记得 GitHub 上有一个 Awesome - XXX 系列的资源整理。[awesome-python](https://github.com/vinta/awesome-python) 是 vinta 发起维护的 Python 资源列表,内容包 阅读全文
posted @ 2018-10-19 11:41 zhong_sp 阅读(1139) 评论(0) 推荐(0) 编辑