摘要: 目录 简介 常用规则 XPath使用方法(lxml.etree) 01 获取父节点 02 获取节点文本 03 属性多值匹配 04 多属性匹配 简介 XPath即为XML路径语言(XML Path Language),它是一种用来确定XML文档中某部分位置的语言。(来源于百度百科) 常用规则 符号含义 阅读全文
posted @ 2020-07-17 23:39 12218 阅读(52) 评论(0) 推荐(0) 编辑
摘要: 目录 简介 常用匹配规则 01 普通字符 02 元字符 03 限定符 04 特殊字符 05 修饰符 re库的部分方法 01 match 02 search 03 findall 04 compile 代码下载 简介 正则表达式,又称规则表达式。(英语:Regular Expression,在代码中常 阅读全文
posted @ 2020-07-17 16:58 12218 阅读(60) 评论(0) 推荐(0) 编辑
摘要: 目录 爬虫的概念 爬虫常用库 Requests库基础用法 01 安装 02 GET请求基本使用 (1) 基本操作 (2) 携带参数 (3) 添加请求头 03 POST请求基本使用 爬虫的概念 网络爬虫(又称为网页蜘蛛,网络机器人,在FOAF社区中间,更经常的称为网页追逐者),是一种按照一定的规则,自 阅读全文
posted @ 2020-07-17 09:06 12218 阅读(72) 评论(0) 推荐(0) 编辑
摘要: 目录 HTTP简介 01HTTP和HTTPS 02查看请求 网页基础 01 网页的组成部分 02 网页的结构与标签 03 网页的属性 HTTP简介 01HTTP和HTTPS 我们在访问某一个网页时,总是能看到申请的url是以http或者https开头的。 http和https都是访问资源时的协议类型 阅读全文
posted @ 2020-07-16 23:54 12218 阅读(53) 评论(0) 推荐(0) 编辑
摘要: 用PSCP在Windows和Linux之间传输文件 PSCP 使用方法 Windows上传到Linux Windows从Linux获取 传输文件夹 PSCP 用过putty的人应该都知道pscp这个东西,基于SSH,可以传输从单个文件到多个文件夹。 这个可执行文件并不能直接打开,而是需要使用命令提示 阅读全文
posted @ 2020-07-16 20:06 12218 阅读(313) 评论(0) 推荐(0) 编辑
摘要: 使用Linux Deploy在手机上安装Ubuntu 前言 准备 安装过程 1.root手机 2.安装BusyBox 3.使用Linux Deploy部署Linux系统 使用 前言 其实很早之前就搞过Linux Deploy,当时弄了很久才弄成功。但是当时并没有记笔记的习惯,今天才发现竟然忘了怎么做 阅读全文
posted @ 2020-07-16 18:41 12218 阅读(612) 评论(0) 推荐(0) 编辑
摘要: Jupyter Notebook开启远程连接 前言 准备工作 开始配置远程连接 使用过程 前言 刚刚接触Linux,用Vim这种编辑器实在用不习惯啊。。。 只好安装了一个Jupyter Notebook,开启远程连接。 准备工作 使用命令行安装Jupyter Notebook,直接输入“pip3 i 阅读全文
posted @ 2020-07-16 16:46 12218 阅读(252) 评论(0) 推荐(0) 编辑
摘要: 爬虫解决Github访问速度慢目录 说明 实现过程 代码下载 说明 由于GitHub收到DNS污染,常常会无法登陆、访问速度慢。 可以采用网络上的一些方法,更改hosts。 但是GitHub的IP地址时不时会发生变化,使用ping有时又ping不通。单独查询每个IP地址又很麻烦。 故此使用pytho 阅读全文
posted @ 2020-07-16 11:18 12218 阅读(374) 评论(0) 推荐(0) 编辑