上一页 1 2 3 4 5 6 ··· 10 下一页
摘要: 标准的异步协程http请求的模板,asyncio, aiohttp import asyncio import aiohttp #在实现该函数的时候,其函数实现内部不可以出现非异步模块的代码 async def request(url): async with aiohttp.ClientSessi 阅读全文
posted @ 2019-05-30 18:07 robertx 阅读(611) 评论(0) 推荐(0) 编辑
摘要: requests模块高级操作 代理相关的操作 验证码的识别 cookie相关操作 模拟登录 一. 代理操作 什么是代理? 就是代理服务器 提供代理的网站: 快代理 西祠代理 goubanjia 代理的匿名度 透明代理: 对方服务器可以知道你使用了代理,并且也知道你的真实ip 匿名代理: 对方服务器可 阅读全文
posted @ 2019-05-29 15:42 robertx 阅读(3226) 评论(0) 推荐(0) 编辑
摘要: 有两种解决方式 1.使用response.encoding = 'utf 8' 2.使用.encode('iso 8859 1').decode('gbk') 爬取美女壁纸缩略图并解决标题乱码问题 阅读全文
posted @ 2019-05-28 22:48 robertx 阅读(2968) 评论(0) 推荐(1) 编辑
摘要: 爬虫的数据解析 两种爬取图片的方法 第一种: 使用with open 保存为文件 第二种: 使用urllib模块 数据解析 常用的python数据解析有四种方式 : 正则 xpath bs4 pyquery 数据解析的原理: 标签的定位 提取标签中存储的文本数据或者标签属性中存储的数据 1.正则解析 阅读全文
posted @ 2019-05-28 22:42 robertx 阅读(340) 评论(0) 推荐(0) 编辑
摘要: 工作区:当前编辑的区域 红色 缓存区:add 之后的区域 绿色 本地仓库:commit之后的区域 远程仓库:远程的区域 一.简单的命令行入门 1.git全局设置 2.创建git仓库 已有仓库? 二.基本命令 查看与添加到缓冲区 回退版本 添加别名 克隆 拉取 三 .stash快照 创建一个快照 取出 阅读全文
posted @ 2019-05-27 20:42 robertx 阅读(147) 评论(0) 推荐(0) 编辑
摘要: requests模块 安装 : 作用:就是用来模拟浏览器上网的。 特点:简单,高效 其他的爬虫模块(old): urllib模块 一. 使用 requests模块的使用流程: 指定url 发起请求 获取响应数据 持久化存储 1.get请求使用 处理get请求的参数 需求:网页采集器 反爬机制:UA检 阅读全文
posted @ 2019-05-27 15:25 robertx 阅读(229) 评论(0) 推荐(0) 编辑
摘要: Robots协议: ​ 每个网站都会设置自己的Robots协议,来明示搜索引擎,哪些内容是愿意和允许被搜索引擎收录的,哪些则不允许。而搜索引擎则会按照Robots协议给与自己的权限来进行抓取。Robots协议已经成为所有搜索引擎必须遵守的国际惯例。 ​ 例:淘宝的robots.txt查看地址为 什么 阅读全文
posted @ 2019-05-27 15:15 robertx 阅读(148) 评论(0) 推荐(0) 编辑
摘要: 用python操作Git 使用第三方模块gitpython 安装 使用 执行Git原生语句的方法 阅读全文
posted @ 2019-05-19 13:39 robertx 阅读(7421) 评论(0) 推荐(1) 编辑
摘要: celery中文译为芹菜,是一个分布式任务队列. 是异步的,所以能处理大量消息 最新的celery不支持windows下使用了,所以在使用pycharm安装celery模块之后,需要再安装eventlet模块才能测试运行. 一.异步任务 启动客户端: s1,s2要在项目目录下,如果在文件夹中执行,t 阅读全文
posted @ 2019-05-09 21:18 robertx 阅读(7123) 评论(1) 推荐(0) 编辑
摘要: roles为完全独立或相互依赖的变量,任务,文件,模板和模块集合提供框架。 在Ansible中,角色是将playbook分成多个文件的主要机制。这简化了编写 复杂的playbook ,并使其更易于重用。破坏playbook允许您在逻辑上将剧本分解为可重用的组件。 每个roles基本上仅限于特定功能或 阅读全文
posted @ 2019-05-09 20:21 robertx 阅读(1441) 评论(0) 推荐(0) 编辑
摘要: playbook更加强大, 等于说写了一个脚本来对多个被控机执行命令.playbook用的是yaml格式 执行示例: 一.playbook格式 基本格式与重要参数 1.单个playbook 示例: 使用user模块添加用户 2.多个playbook play book具有幂等性 不论执行多少次,得到 阅读全文
posted @ 2019-05-07 20:13 robertx 阅读(797) 评论(0) 推荐(0) 编辑
摘要: ansible-doc -s 模块名称 查看使用文档 一.file 文件或者文件夹的操作 参数 示例 软连接与硬连接对比 二.fetch 拉取远程主机的文件,并以主机ip地址或者主机名为目录,并且保留了原来的目录结构 参数 示例 三.yum 安装linux的软件包 1.yum跟rpm有什么关系,有什 阅读全文
posted @ 2019-05-06 21:21 robertx 阅读(222) 评论(0) 推荐(0) 编辑
摘要: ansible 是一个基于python开发的自动化运维工具,可以实现批量系统配置,批量程序部署,批量运行命令 需要管控机和被管控机的时间同步一致, 配置相同的时间服务器即可 一.安装 1.安装wget 需要用到wget命令,如果系统是最小化安装的,那么可能需要先安装wget 2.将epel源安装下载 阅读全文
posted @ 2019-05-05 19:33 robertx 阅读(678) 评论(0) 推荐(0) 编辑
摘要: 一.安装 二.使用 python中对excel表格操作的插件有很多,比如xlwd\xlrt. 而openpyxl只支持excel03之后的版本 1.写入 结果 2.读取 用上面的表作为示例 阅读全文
posted @ 2019-04-30 21:30 robertx 阅读(3024) 评论(0) 推荐(0) 编辑
摘要: 一.分支 二.tag 里程碑,版本的意思 阅读全文
posted @ 2019-04-30 20:56 robertx 阅读(146) 评论(0) 推荐(0) 编辑
上一页 1 2 3 4 5 6 ··· 10 下一页