08 2022 档案
摘要:一、urllib的学习 学习目标 了解urllib的基本使用 1、urllib介绍 除了requests模块可以发送请求之外, urllib模块也可以实现请求的发送,只是操作方法略有不同! urllib在python中分为urllib和urllib2,在python3中为urllib 下面以pyth
阅读全文
摘要:1、xpath安装与使用 安装 安装lxml库 pip install lxml -i pip源 2、解析流程与使用 解析流程 实例化一个etree的对象,把即将被解析的页面源码加载到该对象 调用该对象的xpath方法结合着不同形式的xpath表达进行标签定位和数据提取 使用 导入lxml.etre
阅读全文
摘要:一、beautifulsoup的简单使用 简单来说,Beautiful Soup是python的一个库,最主要的功能是从网页抓取数据。官方解释如下: Beautiful Soup提供一些简单的、python式的函数用来处理导航、搜索、修改分析树等功能。 它是一个工具箱,通过解析文档为用户提供需要抓取
阅读全文
摘要:正则表达式 1、匹配单个字符与数字 匹配说明 . 匹配除换行符以外的任意字符,当flags被设置为re.S时,可以匹配包含换行符以内的所有字符 [] 里面是字符集合,匹配[]里任意一个字符 [0123456789] 匹配任意一个数字字符 [0-9] 匹配任意一个数字字符 [a-z] 匹配任意一个小写
阅读全文
摘要:一、css的语法 什么是css? 层叠样式表 命名规则: 使用字母、数字或下划线和减号构成,不要以数字开头 格式: 选择器{属性:值;属性:值;属性:值;....} 其中选择器也叫选择符 CSS中注释 /* ... */ 二、在HTML中如何使用css样式(html中嵌入css的方式) 1、内联方式
阅读全文
摘要:一、什么是HTML? 超文本标记语言 (1) 标签 也叫做 标记+ (2) html是由标签/标记 和内容组成的 (3) 标签 是由 标签名称 和属性组成的 实例: <人 肤色=“黄色” 眼镜="很大"></人> 扩展: 使用协议为 http超文本传输协议 普通文本:文字内容 超文本:视频、音频、图
阅读全文
摘要:字符集和bytes 字符集, 记住两个字符集就够了. 一个是utf-8, 一个是gbk. 都是支持中文的. 但是utf-8的编码数量远大于gbk. 我们平时使用的最多的是utf-8 # 把字符串转化成字节bs = "我的天哪abcdef".encode("utf-8")print(bs) # b'\
阅读全文
摘要:基础语法相关 1.if条件判断 if 条件: # 事情1else: # 事情2 当你需要判断的时候. 就去写if. 举例, 在写爬虫的时候. 我们会遇到这样的两种情况 情况一, 数据里有一些我们并不需要的内容 data = "10,英雄本色,1500万" # 正常你需要的数据data = "11,-
阅读全文
摘要:实现Nginx负载均衡的组件主要有两个,如下表: 准备4台VM虚拟机(有物理服务器更佳),两台做负载均衡,两台做RS,如下表: HOSTNAME IP 说明 lb01 192.168.0.221 Nginx主负载均衡器 lb02 192.168.0.222 Nginx副负载均衡器 web01 192
阅读全文
摘要:Nginx软件的主要企业功能应用 (1)作为Web服务软件 Nginx是一个支持高性能,高并发的Web服务软件,它具有很多优秀的特性,作为Web服务器,与Apache相比,Nginx能够支持更多的并发连接访问,但占用的资源更少,效率更高,在功能上也强大了很多,几乎不逊色于Apache。 (2)反向代
阅读全文