wutao1935

导航

2021年11月19日 #

python 爬虫学习笔记1

摘要: requests模块 - urllib模块 - requests模块 requests模块:python中原生的一款基于网络请求的模块,功能非常强大,简单便捷,效率极高。 作用:模拟浏览器发请求。 如何使用:(requests模块的编码流程) - 指定url - UA伪装 - 请求参数的处理 - 发 阅读全文

posted @ 2021-11-19 09:35 逐风浪子 阅读(61) 评论(0) 推荐(0) 编辑

python 爬虫学习笔记2

摘要: 聚焦爬虫:爬取页面中指定的页面内容。 - 编码流程: - 指定url - 发起请求 - 获取响应数据 - 数据解析 - 持久化存储 数据解析分类: - 正则 - bs4 - xpath(***) 数据解析原理概述: - 解析的局部的文本内容都会在标签之间或者标签对应的属性中进行存储 - 1.进行指定 阅读全文

posted @ 2021-11-19 09:32 逐风浪子 阅读(57) 评论(0) 推荐(0) 编辑

python 爬取腾讯漫画(免费)

摘要: python 爬取腾讯漫画(免费)亲测有效 1 import requests 2 from lxml import html 3 from selenium import webdriver 4 from time import sleep 5 from bs4 import BeautifulS 阅读全文

posted @ 2021-11-19 09:25 逐风浪子 阅读(512) 评论(0) 推荐(0) 编辑