摘要: 三国演义内容抓取(诗词名句网) 时间:2024-08-06 一、完整代码 import random import time import requests from lxml import etree four_famous_novels = 'https://www.shicimingju.co 阅读全文
posted @ 2024-08-07 00:15 随风小屋 阅读(14) 评论(0) 推荐(0) 编辑
摘要: 中信证券抓取(页码范围) 创建时间:2024年8月5日 一、完整代码 import re import requests from lxml import etree headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x6 阅读全文
posted @ 2024-08-07 00:13 随风小屋 阅读(15) 评论(0) 推荐(0) 编辑
摘要: 腾牛网抓取(单页) 创建时间:2024-08-05 一、完整代码 import requests from lxml import etree url = 'https://www.qqtn.com/wm/meinvtp_1.html' header = { 'User-Agent': 'Mozil 阅读全文
posted @ 2024-08-07 00:10 随风小屋 阅读(24) 评论(0) 推荐(0) 编辑
摘要: 表情党抓取(单页) (网站已转移) 创建时间:2024-08-06 一、完整代码 import requests from lxml import etree url = 'https://qq.yh31.com/xq/wq/' header = { 'User-Agent': 'Mozilla/5 阅读全文
posted @ 2024-08-07 00:06 随风小屋 阅读(11) 评论(0) 推荐(0) 编辑
摘要: 抓取金投网文本数据(xpath练习) 创建时间:2024年8月5日 一、完整代码 import requests from lxml import etree header = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) Ap 阅读全文
posted @ 2024-08-07 00:00 随风小屋 阅读(8) 评论(0) 推荐(0) 编辑