摘要: 1、元字符介绍 "^" :^会匹配行或者字符串的起始位置,有时还会匹配整个文档的起始位置。 "$" :$会匹配行或字符串的结尾 "\b" :不会消耗任何字符只匹配一个位置,常用于匹配单词边界 如 我想从字符串中"This is Regex"匹配单独的单词 "is" 正则就要写成 "\bis\b" " 阅读全文
posted @ 2019-12-23 11:11 高文祥888888 阅读(174) 评论(0) 推荐(0) 编辑
摘要: 一、中国天气网爬虫案例 #中国天气网爬虫 import requests from pyecharts.charts import Bar from bs4 import BeautifulSoup import copy import html5lib datas = [] data = { "c 阅读全文
posted @ 2019-12-11 20:34 高文祥888888 阅读(212) 评论(0) 推荐(0) 编辑
摘要: BeautifulSoupeautifulSoup使用笔记 from bs4 import BeautifulSoup ''' 1、find_all的使用: soup.find_all("ul");soup.find_all("ul",limit=2)[1];find_all("ul",class_ 阅读全文
posted @ 2019-12-09 19:28 高文祥888888 阅读(369) 评论(0) 推荐(0) 编辑
摘要: #电影天堂电影爬虫import requestsfrom lxml import etreeimport timeimport warningswarnings.filterwarnings('ignore')DOMAIN = "https://dytt8.net"HEADERS = { "Refe 阅读全文
posted @ 2019-12-05 18:50 高文祥888888 阅读(693) 评论(0) 推荐(0) 编辑
摘要: 一、request.get()方法 import requestsheaders = { "User-Agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/78. 阅读全文
posted @ 2019-12-02 13:38 高文祥888888 阅读(1426) 评论(0) 推荐(0) 编辑
摘要: 1、urllib库 request模块: 1、发送请求:request.urlopen(url); 2、下载网页:request.urlretrieve(url); 3、代理模块:ProxyHandler 1、使用proxyHandler,传入代理构建一个handler handler = requ 阅读全文
posted @ 2019-11-29 11:33 高文祥888888 阅读(136) 评论(0) 推荐(0) 编辑
摘要: 前言: 在开发及测试过程中,系统的安全性是不得不考虑的问题,一旦系统出现安全问题,轻则用户信息或系统数据被盗,重则导致公司资金流失,因此写此文档以此 来记录那些年,我们曾经犯过的错,用于警醒后人。文章将包含通用的安全漏洞及特殊案例。 一:短信。短信发送可能存在的安全漏洞有: 1、短信轰炸。攻击手段: 阅读全文
posted @ 2019-11-13 13:50 高文祥888888 阅读(352) 评论(0) 推荐(0) 编辑
摘要: 一、使用cookie进行登录验证 由于http是无状态的协议,因此每次发起一个请求http请求的时候,服务器都不知道你之前是否发过请求,举个简单的例子。这样对于需要登录认证的请求而言,每次请求的时候都需要重新输入认证信息,这样显然让用户很不爽,我们可以使用cookie来解决这个问题,具体原理为:用户 阅读全文
posted @ 2018-07-06 11:12 高文祥888888 阅读(455) 评论(0) 推荐(0) 编辑
摘要: 一、环境搭建 Scrapy是一个比较好的爬虫框架,本次,我们学习一下,使用Scrapy框架来创建一个爬虫项目,并通过一个简单的例子演示一下。 第一步:安装依赖。首先先保证已经安装了python,pip。然后使用pip进行一下依赖的安装,顺序为: 1、wheel 2、 lxml 3、PyOpenssl 阅读全文
posted @ 2018-07-03 18:33 高文祥888888 阅读(192) 评论(0) 推荐(0) 编辑
摘要: 一、路由系统URL 我们知道路由url主要用于管理url和方法之间的映射关系,像这样就是把index页面映射到index方法进行处理。也就是说,每次请求一个url就会到django的url文件中进行查找,找到了就会将请求转向对应的处理方法,找不到就会not found。既然是匹配查找,那么我们可不可 阅读全文
posted @ 2018-05-18 14:20 高文祥888888 阅读(213) 评论(0) 推荐(0) 编辑