摘要:
协程 任务对象绑定回调 多任务异步协程 多任务异步爬虫 aiohttp使用 案列 阅读全文
摘要:
from multiprocessing.dummy import Pool #线程池模块 #必须只可以有一个参数 def my_requests(url): return requests.get(url=url,headers=headers).text start = time.time() 阅读全文
摘要:
selenium简介 介绍 Selenium [1] 是一个用于Web应用程序测试的工具。Selenium测试直接运行在浏览器中,就像真正的用户在操作一样。支持的浏览器包括IE(7, 8, 9, 10, 11),Mozilla Firefox,Safari,Google Chrome,Opera等。 阅读全文
摘要:
喜马拉雅 网页分析 1 2 3 4 5 6 7 8 - 打开我们要爬取的音乐专辑https://www.ximalaya.com/ertong/424529/ - F12打开开发者工具 - 点击XHR 随便点击一首歌曲会看到存储所有歌曲的地址【json格式】 - 正常情况下我们直接用requests 阅读全文
摘要:
介绍 Base64是网络上最常见的用于传输8Bit字节码的编码方式之一,Base64就是一种基于64个可打印字符来表示二进制数据的方法。可查看RFC2045~RFC2049,上面有MIME的详细规范。 Base64编码是从二进制到字符的过程,可用于在HTTP环境下传递较长的标识信息。采用Base64 阅读全文
摘要:
JS运行环境 Node.js 是Javascript语言服务器端运行环境 安装和配置:https://www.runoob.com/nodejs/nodejs-install-setup.html 测试运行 测试运行JavaScript程序 微软windows操作系统:附件-命令提示符 需进入到js 阅读全文
摘要:
初始化 字符串的形式初始化 URL初始化 文件初始化 css选择器 查找节点 子节点 获取所有子孙节点 获取所有子节点 通过css选择器选择子节点中的某个节点 父节点 直接父节点 祖先节点 通过css选择器选择父节点中的某个节点 兄弟节点 获取所有兄弟节点 通过css选择器选择兄弟节点中的某个节点 阅读全文
摘要:
简介 XPath即为XML路径语言(XML Path Language),它是一种用来确定XML文档中某部分位置的语言。 XPath基于XML的树状结构,提供在数据结构树中找寻节点的能力。起初XPath的提出的初衷是将其作为一个通用的、介于XPointer与XSL间的语法模型。但是XPath很快的被 阅读全文
摘要:
介绍 Beautiful Soup是python的一个库,最主要的功能是从网页抓取数据。官方解释如下: 使用方法 项目演示 select选择器选择a标签中的文本内容和gref属性 效果 阅读全文
摘要:
几种常用模块的使用方法 注释:Excel 2003 即XLS文件有大小限制即65536行256列,所以不支持大文件,而Excel 2007以上即XLSX文件的限制则为1048576行16384列 下面则为几种模块的使用: 1.xlwt 写入xls文件内容 2.xlrd读取xls文件内容 3.综合使用 阅读全文