摘要: 工作区:当前编辑的区域 红色 缓存区:add 之后的区域 绿色 本地仓库:commit之后的区域 远程仓库:远程的区域 一.简单的命令行入门 1.git全局设置 2.创建git仓库 已有仓库? 二.基本命令 查看与添加到缓冲区 回退版本 添加别名 克隆 拉取 三 .stash快照 创建一个快照 取出 阅读全文
posted @ 2019-05-27 20:42 robertx 阅读(147) 评论(0) 推荐(0) 编辑
摘要: requests模块 安装 : 作用:就是用来模拟浏览器上网的。 特点:简单,高效 其他的爬虫模块(old): urllib模块 一. 使用 requests模块的使用流程: 指定url 发起请求 获取响应数据 持久化存储 1.get请求使用 处理get请求的参数 需求:网页采集器 反爬机制:UA检 阅读全文
posted @ 2019-05-27 15:25 robertx 阅读(229) 评论(0) 推荐(0) 编辑
摘要: Robots协议: ​ 每个网站都会设置自己的Robots协议,来明示搜索引擎,哪些内容是愿意和允许被搜索引擎收录的,哪些则不允许。而搜索引擎则会按照Robots协议给与自己的权限来进行抓取。Robots协议已经成为所有搜索引擎必须遵守的国际惯例。 ​ 例:淘宝的robots.txt查看地址为 什么 阅读全文
posted @ 2019-05-27 15:15 robertx 阅读(148) 评论(0) 推荐(0) 编辑