摘要:
selenium 爬虫与反爬虫之间的斗争 爬虫:对某个网站数据或图片感兴趣,开始抓取网站信息; 网站:请求次数频繁,并且访问ip固定,user_agent也是python,开始限制访问; 爬虫:通过设置user_agent,并添加代理ip请求; 网站:压力过大,不符合常规现象,开始设置登陆访问; 爬 阅读全文
摘要:
多进程 使用进程实现多任务 multiprocessing模块就是跨平台的多进程模块提供了有个Process类来代表一个进程对象,这个对象可以理解为一个独立的进程,可以执行另外的事情 进程和线程之间的对比 进程:能够完成多任务,一台电脑可以开多个浏览器 线程:能够完成多任务,一个微信可以同时和多人聊 阅读全文
摘要:
线程安全队列 python内置的线程安全队列模块叫queue Python的Queue模块中提供了同步的、线程安全的队列类 FIFO(先进先出) 队列Queue LIFO(后进先出)LifoQueue 可以使用队列来实现线程间的同步 队列的常用方法 | 函数 | 描述 | | | | | qsize 阅读全文
摘要:
多线程 程序同时执行多个任务 使用线程可以把占据长时间的程序中的任务放到后台去处理。 程序的运行速度可能加快 线程实现方法 线程是CPU分配资源的基本单位。当一程序开始运行,这个程序就变成了一个进程,而一个进程相当于一个或者多个线程。当没有多线程编程时,一个进程相当于一个主线程;当有多线程编程时,一 阅读全文
摘要:
MongoDB 安装MongoDB 官方网站:https://www.mongodb.com/try/download/community-kubernetes-operator2 软件安装 step1:以管理员的身份打开安装包直接点击Next step2:继续点击Next step3:点击自定义安 阅读全文
摘要:
MySQL MySQL 是一个关系型数据库管理系统,由瑞典 MySQL AB 公司开发,目前属于 Oracle 公司。MySQL 是一种关联数据库管理系统,关联数据库将数据保存在不同的表中,而不是将所有数据放在一个大仓库内,这样就增加了速度并提高了灵活性。 安装MySQL 下载地址:https:// 阅读全文
摘要:
正则表达式 认识正则 正则表达式,又称规则表达式**,**(Regular Expression,在代码中常简写为regex、regexp或RE),是一种文本模式,包括普通字符(例如,a 到 z 之间的字母)和特殊字符(称为"元字符"),是计算机科学的一个概念。正则表达式使用单个字符串来描述、匹配一 阅读全文
摘要:
bs4解析 下载 -- pip install bs4 示例代码-爱丽丝漫游仙境 html_doc = """ <html><head><title>The Dormouse's story</title></head> <body> <p class="title"><b>The Dormou 阅读全文
摘要:
xpath语法 XPath 使用路径表达式来选取HTML/ XML 文档中的节点或节点集。节点是通过沿着路径 (path) 或者步 (steps) 来选取的。 选取节点 | 表达式 | 描述 | | : : | | | nodename | 选取此节点的所有子节点。 | | / | 从根节点选取(取 阅读全文
摘要:
requests 图片下载 post请求 session requests下载图片 下载图片,需获取到图片的url地址和图片名称,通过向图片url发起请求,之后获取.content 注意: .text返回的是Unicode型的数据。 .content返回的是bytes型也就是二进制的数据。 url 阅读全文