03 2020 档案

redis 提供 6种数据淘汰策略

摘要：redis 提供 6种数据淘汰策略淘汰策略的原因在 redis 中，允许用户设置最大使用内存大小 server.maxmemory，在内存限定的情况下是很有用的。譬如，在一台 8G 机子上部署了 4 个 redis 服务点，每一个服务点分配 1.5G 的内存大小，减少内存紧张的情况，由此获取更为阅读全文

posted @ 2020-03-26 10:33 小学弟- 阅读(1443) 评论(0) 推荐(0) 编辑

scrapy中selenium的应用

摘要：scrapy中selenium的应用引入在通过scrapy框架进行某些网站数据爬取的时候，往往会碰到页面动态数据加载的情况发生，如果直接使用scrapy对其url发请求，是绝对获取不到那部分动态加载出来的数据值。但是通过观察我们会发现，通过浏览器进行url请求发送则会加载出对应的动态加载出的数据阅读全文

posted @ 2020-03-16 11:51 小学弟- 阅读(126) 评论(0) 推荐(0) 编辑

redis批量删除

摘要：redis由于测试产生了一批垃圾数据,想要批量删除之默认db0,redis-cli 带参数 -n可以指定数据库,完整命令: redis-cli -h DB_port -a DB_pwd -n DB_idx keys “key_prefix*” | xargs redis-cli -h DB_por 阅读全文

posted @ 2020-03-06 18:20 小学弟- 阅读(297) 评论(0) 推荐(0) 编辑

scrapy异常状态码处理

摘要：scrapy异常状态码处理在setting.py中加入 scrapy 的 state 默认只处理200到300之间 # 403状态的响应不被自动忽略，对403 的响应做个性化处理 HTTPERROR_ALLOWED_CODES = [403] # 遇到错误忽略掉不重新请求，则设成[] RETRY_ 阅读全文

posted @ 2020-03-04 17:36 小学弟- 阅读(1303) 评论(0) 推荐(0) 编辑

公告

想说的话：

昵称：小学弟-
园龄： 7年1个月
粉丝： 77
关注： 22

+加关注

2025年3月

日

一

二

三

四

五

六

03 2020 档案

公告

搜索

常用链接

随笔分类

随笔档案

阅读排行榜

评论排行榜

推荐排行榜

最新评论