摘要:
scrapy之日志等级 在settings.py中配置如下项: 这样设置的好处是降低CPU的使用率,提高爬虫的效率。 阅读全文
摘要:
scrapy之五大核心组件 scrapy一共有五大核心组件,分别为引擎、下载器、调度器、spider(爬虫文件)、管道。 爬虫文件的作用: a. 解析数据 b. 发请求 调度器: a. 队列 队列是一种数据结构,拥有先进先出的特性。 b. 过滤器 过滤器适用于过滤的,过滤重复的请求。 调度器是用来调 阅读全文
摘要:
Windows之PowerShell使用命令 切换 命令格式: cd [option] 返回到上一层目录 或者 进入文件夹 不同磁盘之间切换 清屏 清空当前窗口的内容 查看当前文件夹目录 展示当前文件夹的详细信息 结果: 退出 快捷键 退出当前执行的的程序 Ctrl + C 命令 查看 查看IP地址 阅读全文