2019年3月8日

爬虫--图片懒加载解决方案

摘要: 动态数据加载处理 一.图片懒加载 什么是图片懒加载? 案例分析:抓取站长素材http://sc.chinaz.com/中的图片数据 #!/usr/bin/env python # -*- coding:utf-8 -*- import requests from lxml import etree 阅读全文

posted @ 2019-03-08 10:45 你说我记 阅读(2696) 评论(0) 推荐(0) 编辑

爬虫--XPATH解析

摘要: 今天说一下关于爬取数据解析的方式 >XPATH,XPATH是解析方式中最重要的一种方式 1.安装:pip install lxml 2.原理 1. 获取页面源码数据 2.实例化一个etree的对象,并且将页面源码数据加载到该对象中 3.调用该对象的xpath方法进行指定标签的定位 4.注意:xpat 阅读全文

posted @ 2019-03-08 10:37 你说我记 阅读(443) 评论(0) 推荐(0) 编辑

导航