摘要: lxml库 lxml是一个HTML/XML的解析器,主要的功能是如何解析和提取 HTML/XML数据。 基本使用: 1.我们可以利用他来解析HTML代码,并且在解析HTML代码的时候,如果HTML代码不规范,他会自动的进行补全。 2.从文件中读取html代码: 在上代码中,如果html代码不是很规范 阅读全文
posted @ 2018-10-01 16:56 cmap 阅读(859) 评论(0) 推荐(0) 编辑
摘要: requests库 get请求: 1.通过requests.get()来调用: 2.添加header和查询参数: 如传入参数的get请求: 查询参数: response.text和response.content的区别: 1.response.content:这个是直接从网络上面抓取的数据。没有经过 阅读全文
posted @ 2018-10-01 11:56 cmap 阅读(310) 评论(0) 推荐(0) 编辑