上一页 1 ··· 13 14 15 16 17 18 19 20 21 ··· 42 下一页
2020年4月14日
摘要: Paramiko 远程连接 通过 ssh 远程链接服务器并执行响应的操作,类似于 XShell ansible 批量管理服务器工具,底层用的就是 paramiko 模块 安装 基本使用 远程链接服务器的方式 用户名和密码 公钥私钥的方式 执行命令 用户名和密码方式 公钥私钥的方式 上传下载文件 如果 阅读全文
posted @ 2020-04-14 15:42 Rannie` 阅读(148) 评论(0) 推荐(0) 编辑
摘要: Django 基于channels实现群聊功能 后端框架 django 默认不支持 websocket 第三方模块: channels flask 默认不支持 websocket 第三方模块: geventwebsocket tornado 默认支持 websocket 下载 channel s模块 阅读全文
posted @ 2020-04-14 15:32 Rannie` 阅读(1332) 评论(0) 推荐(0) 编辑
摘要: gojs 插件 是一个前端插件,跟 go 和 js 没有半毛钱关系 主要可以通过代码动态的生成和修改图表数据(组织架构图,执行流程图等等) 网址: 如果你想使用,需要下载他的文件 目前需要我们了解的文件其实只有三个,用得到的只有两个 基本使用 gojs 使用基本套路是先在页面上写一个 div 站地方 阅读全文
posted @ 2020-04-14 15:15 Rannie` 阅读(249) 评论(0) 推荐(0) 编辑
2020年4月13日
摘要: [TOC] 代码发布 服务端主动给客户端推送消息 截至目前为止,我们所写的 web 项目基本都是基于 HTTP 协议的 "HTTP 协议有四大特性" :无链接 基于 HTTP 协议实现服务端主动给客户端推送消息好像有点麻烦~~~ 我们都经历过,浏览器打开一个网站不动,网站过一会儿自动弹出消息 再比如 阅读全文
posted @ 2020-04-13 16:31 Rannie` 阅读(5337) 评论(0) 推荐(0) 编辑
2020年4月12日
摘要: 在爬虫已启动,就打开一个 chrom 浏览器,以后都用这一个浏览器来爬数据 1 在爬虫中创建 bro 对象 在 middlewares.py 中定义一个 class: spider中的代码: 下载中间件使用 把 selenium 集成到 scrapy 中主要改变的就是这两处地方 以上的在 scrap 阅读全文
posted @ 2020-04-12 19:43 Rannie` 阅读(312) 评论(0) 推荐(0) 编辑
摘要: [TOC] 介绍 原来 scrapy 的 Scheduler 维护的是本机的任务队列(存放 Request 对象及其回调函数等信息)+ 本机的去重队列(存放访问过的url地址) 所以实现分布式爬取的关键就是,找一台专门的主机上运行一个共享的队列比如 Redis, 然后重写 Scrapy 的 Sche 阅读全文
posted @ 2020-04-12 18:29 Rannie` 阅读(212) 评论(0) 推荐(0) 编辑
摘要: [TOC] 在开始介绍 scrapy 的去重之前,先想想我们是怎么对 requests 对去重的。 requests 只是下载器,本身并没有提供去重功能。所以我们需要自己去做。 很典型的做法是事先定义一个去重队列,判断抓取的 url 是否在其中,如 此时的集合是保存在内存中的,随着爬虫抓取内容变多, 阅读全文
posted @ 2020-04-12 17:54 Rannie` 阅读(364) 评论(0) 推荐(0) 编辑
2020年4月11日
摘要: [TOC] 下载中间件(Downloader Middleware) 下载器中间件是介于 Scrapy 的 request/response 处理的钩子框架。 是用于全局修改 Scrapy request 和r esponse 的一个轻量、底层的系统 这个介绍看起来非常绕口,但其实用容易理解的话表述 阅读全文
posted @ 2020-04-11 21:34 Rannie` 阅读(411) 评论(0) 推荐(0) 编辑
摘要: [TOC] cnblogs_spider.py 普通 scrapy piplines.py 分布式爬取 cnblogs_spider.py settings.py 阅读全文
posted @ 2020-04-11 19:18 Rannie` 阅读(202) 评论(0) 推荐(0) 编辑
2020年4月10日
摘要: [TOC] Scrapy Scrapy 是一个为了爬取网站数据,提取结构性数据而编写的应用框架。 可以应用在包括数据挖掘,信息处理或存储历史数据等一系列的程序中 安装 mac,linux 平台:pip3 install scrapy windows 平台:pip3 install scrapy 如果 阅读全文
posted @ 2020-04-10 16:52 Rannie` 阅读(240) 评论(0) 推荐(0) 编辑
上一页 1 ··· 13 14 15 16 17 18 19 20 21 ··· 42 下一页
去除动画
找回动画