信2005-2赵磊 - 博客园

2023年5月5日

摘要： Pytest 命名：文件：以text_开头或者_text结尾类：Text开头方法/函数（类内方法，类外函数）： text_开头测试包无要求测试类不可以添加_init_构造函数 Pytest 在pycharm设置后，会自动识别命名正确的函数和方法用例结构：用例名称用例步骤用例断言类阅读全文

posted @ 2023-05-05 21:49 信2005-2赵磊阅读(22) 评论(0) 推荐(0)

2023年3月2日

大型网站构架-安全

摘要：网站应用与防御 XSS攻击：站点脚本攻击，指黑客通过篡改网页，注入恶意HTML脚本，在用户浏览网页时，控制用户浏览器进行恶意操作的一种攻击方式；常见的XSS攻击类型主要有2种：反射型和持久型XSS攻击。反射型：攻击者诱使用户点击一个嵌入恶意脚本的链接，达到攻击的目的持久型XSS攻击：黑客提交含有阅读全文

posted @ 2023-03-02 18:11 信2005-2赵磊阅读(49) 评论(0) 推荐(0)

2023年2月18日

架构漫谈读后感

摘要：架构漫谈指出的问题：什么是架构，架构为谁服务，以及为什么要有架构。用一句话总结就是架构服务于人，将复杂问题简单化，简单问题流程化。文章指出，每个角色的能力都是有限的，为了节省时间，提高效率以及完善这个系统，我们引出了架构这个概念。架构完成的很巧妙，既要结合成整体的角色之间干好自己的事情，组成的整体阅读全文

posted @ 2023-02-18 15:52 信2005-2赵磊阅读(42) 评论(0) 推荐(0)

2023年1月4日

scrapy 的post请求

摘要： import scrapy import json class TestpostSpider(scrapy.Spider): name = 'testpost' allowed_domains = ['https://fanyi.baidu.com/sug'] # post请求如果没有参数那么这阅读全文

posted @ 2023-01-04 22:23 信2005-2赵磊阅读(35) 评论(0) 推荐(0)

日志信息和日志等级

摘要：（1）日志级别： CRITICAL：严重错误 ERROR：一般错误 WARNING：警告 INFO: 一般信息 DEBUG：调试信息默认的日志等级是DEBUG 只要出现了DEBUG或者DEBUG以上等级的日志那么这些日志将会打印（2）settings.py文件设置：默认的级别为DEBU 阅读全文

posted @ 2023-01-04 21:55 信2005-2赵磊阅读(86) 评论(0) 推荐(0)

CrawlSider && 数据库

摘要： CrawlSider: 1.继承自scrapy.Spider 2.独门秘笈 CrawlSpider可以定义规则，再解析html内容的时候，可以根据链接规则提取出指定的链接，然后再向这些链接发送请求所以，如果有需要跟进链接的需求，意思就是爬取了网页之后，需要提取链接再次爬取，使用CrawlSpid 阅读全文

posted @ 2023-01-04 21:23 信2005-2赵磊阅读(46) 评论(0) 推荐(0)

scrapy 案例：电影天堂多数据下载

摘要：设计多个页面的时候，要用到meta参数获取第一页的链接，第二页的图片。 import scrapy from scrapy_movie_099.items import ScrapyMovie099Item class MvSpider(scrapy.Spider): name = 'mv' al 阅读全文

posted @ 2023-01-04 14:29 信2005-2赵磊阅读(203) 评论(0) 推荐(0)

Yyield && scrapy案例：当当网爬取数据 &&开启多管道下载

摘要： yield 开启多管道在setting.py中新开一个管道，pipelines 下写详细，注意url地址。当当网爬取案例 import scrapy from scrapy_dangdang_095.items import ScrapyDangdang095Item class DangSpi 阅读全文

posted @ 2023-01-04 13:28 信2005-2赵磊阅读(110) 评论(0) 推荐(0)

scrapy shell && ipython

摘要： scrapy shell ： Scrapy终端，是一个交互终端，供您在未启动spider的情况下尝试及调试您的爬取代码。其本意是用来测试提取数据的代码，不过您可以将其作为正常的Python终端，在上面测试任何的Python代码。该终端是用来测试XPath或CSS表达式，查看他们的工作方式及从爬取阅读全文

posted @ 2023-01-04 10:45 信2005-2赵磊阅读(35) 评论(0) 推荐(0)

scarpy架构组成和工作原理

摘要：汽车之间案例： import scrapy class CarSpider(scrapy.Spider): name = 'car' allowed_domains = ['https://car.autohome.com.cn/price/brand-15.html'] # 注意如果你的请求的接口阅读全文

posted @ 2023-01-04 10:27 信2005-2赵磊阅读(49) 评论(0) 推荐(0)

XIAOZHAOZHAO

公告