GroundControl_852

  博客园  :: 首页  :: 新随笔  :: 联系 :: 订阅 订阅  :: 管理

2020年5月8日

摘要: 豆瓣电视剧爬虫 # coding=utf-8 import requests import json class DoubanSpider(): def __init__(self): self.url_temp_list=[ {"url_temp":"https://m.douban.com/re 阅读全文
posted @ 2020-05-08 17:12 GroundControl_852 阅读(343) 评论(0) 推荐(1) 编辑

摘要: 爬取思路 清楚爬取需求,我们要爬取电影名字,导演名字,电影上映时间,电影类型,制片国家,评分人数和电影简介 首先从网页上分析,网页数据不是由ajax抓取,因此我们直接用这个网站url发送请求获取数据,从网页源码上看我们可以从第一层网页中获取到影名字,导演名字,电影上映时间,电影类型,制片国家,评分人 阅读全文
posted @ 2020-05-08 16:52 GroundControl_852 阅读(343) 评论(0) 推荐(0) 编辑