摘要: 实验目的: 爬取梨视频网站某模块全部信息; 字段信息为:视频标题、作者、点赞数,纯视频链接,并且存入txt文档。 实验过程截图: 源码: 1 import requests 2 from lxml import etree 3 from urllib import request 4 import 阅读全文
posted @ 2020-09-03 21:19 ༺aoke༻ 阅读(676) 评论(0) 推荐(0) 编辑
摘要: 运行截图: 1 import requests 2 from lxml import etree 3 from urllib import request 4 5 # 全局变量(请求头+文件IO对象) 6 headers = { 7 'User-Agent': 'Mozilla/5.0 (Windo 阅读全文
posted @ 2020-09-03 18:01 ༺aoke༻ 阅读(344) 评论(0) 推荐(0) 编辑
摘要: 实验内容: 爬取斗鱼视频某一板块的内容 采集字段:房间名、主播名、分类信息、热度 流程图: 源码: 1 import requests 2 from lxml import etree 3 from urllib import request 4 import json 5 6 # 全局变量(请求头 阅读全文
posted @ 2020-09-03 17:46 ༺aoke༻ 阅读(478) 评论(0) 推荐(0) 编辑