不会编程的小卜
人生没有白走的路,每一步都算数
摘要: 读写分离 其基本原理就是让主数据库处理事务性增,改,删操作(INSERT,UPDATE,DELETE)操作,而从数据库处理SELECT查询操作,数据库复制被用来把事物性操作导致的变更同步到其他从数据库,以SQL为例,主数据库负责写数据,读数据,读库仅负责读数据,每次有写库操作,同步更新到读库,写库就 阅读全文
posted @ 2019-05-27 16:40 不会编程的小卜 阅读(381) 评论(0) 推荐(0) 编辑
摘要: 一、获取远程库信息 二、克隆远程库 三、提交代码 四、解决冲突 阅读全文
posted @ 2019-05-23 15:09 不会编程的小卜 阅读(572) 评论(0) 推荐(0) 编辑
摘要: 分支管理 一、分支推进 主分支 单线分支,随着代码的提交而形成的一条直线,HEAD 随着commit提交之后的节点移动而移动。 子分支 当切换到子分支的时候,HEAD 则指向子分支的节点。 在子分支上commit提交,则子分支到下一个节点,主分支不变。 切换到主分支上,HEAD 则指向主分支。 当主 阅读全文
posted @ 2019-05-23 15:07 不会编程的小卜 阅读(225) 评论(0) 推荐(0) 编辑
摘要: Git使用指南 配置全局信息 用户信息配置 创建初始仓库 创建一个版本库文件夹 md F:\\learngit 初始化仓库 $ cd f:/learngit $ git init $ touch readme.txt 常用命令 查看状态 git status 添加文件到仓库 git add file 阅读全文
posted @ 2019-05-23 14:53 不会编程的小卜 阅读(160) 评论(0) 推荐(0) 编辑
摘要: Git的简单介绍 Git是一个开源的分布式版本控制系统,可以有效,高速的处理从很小到非常大的项目管理,GIT是为了帮助linux内核开发而开发的一个开放源码的版本控制软件 Git的安装 Linux平台上的安装 Git 的工作需要调用 curl,zlib,openssl,expat,libiconv 阅读全文
posted @ 2019-05-23 14:49 不会编程的小卜 阅读(111) 评论(0) 推荐(0) 编辑
摘要: 二分查找法 阅读全文
posted @ 2019-05-20 11:43 不会编程的小卜 阅读(194) 评论(0) 推荐(0) 编辑
摘要: 数据解析的原理 1.实现标签的定位 2.将标签中的存储的文本内容或者相关的属性值进行提取 正则 爬虫练习之爬取糗事百科 BS4 环境安装 1.pip install BS4 2.pip install lxml 解析原理 实例化一个BeautifulSoup对象,必须把即将被解析的页面源码加载到该对 阅读全文
posted @ 2019-05-11 15:51 不会编程的小卜 阅读(503) 评论(0) 推荐(0) 编辑
摘要: 简介 selenium最初是一个自动化测试工具,而爬虫中使用它主要是为了解决requests无法直接执行JavaScript代码的问题 selenium本质是通过驱动浏览器,完全模拟浏览器的操作,比如跳转、输入、点击、下拉等,来拿到网页渲染之后的结果,可支持多种浏览器 作用: 可以让浏览器完成相关自 阅读全文
posted @ 2019-05-11 15:22 不会编程的小卜 阅读(734) 评论(0) 推荐(0) 编辑
摘要: 在我们爬取网页的时候,可能会遇到乱码的问题,解决这种的乱码的问题有一种通用的方法 阅读全文
posted @ 2019-05-11 15:19 不会编程的小卜 阅读(547) 评论(0) 推荐(0) 编辑
摘要: 三种方式: 1.多进程多线程(不建议) 2.进程池或者线程池(适当) 3.单线程+异步协程(推荐) 多进程多线程 占用cpu资源,不建议使用 基于线程池的异步爬虫 结果: 单线程+异步协程 基本使用 task的使用 future的使用 绑定回调 多任务异步协程 执行结果: 结果发现,并没有实现异步, 阅读全文
posted @ 2019-05-07 21:35 不会编程的小卜 阅读(493) 评论(0) 推荐(0) 编辑