正则爬取豆瓣Top250数据存储到CSV文件（6行代码）

利用正则爬取豆瓣TOP250电影信息

电影名字
电影年份
电影评分
评论人数

import requests
import csv
import re
# 不算导包的话正式代码6行 存储到csv文件
url = "https://movie.douban.com/top250?start={}&filter="
headers = {"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/90.0.4430.212 Safari/537.36"}
obj = re.compile(r'a.*?<span class="title">(.*?)</span>.*?<br>\s+(.*?)&.*?:average">(.*?)</span>.*?<span>(.*?)人评价</span>', re.S)
with open('douban250.csv', 'w', encoding='utf-8', newline='') as file:
    csv_write = csv.writer(file)
    [csv_write.writerows(obj.findall(requests.get(url=url.format(page), headers=headers).text)) for page in range(0, 226, 25)]

posted @ 2022-09-19 22:24 ゐ叶う枫ゆ阅读(91) 评论(0) 收藏举报

刷新页面返回顶部

lengyingmofeng

正则爬取豆瓣Top250数据存储到CSV文件（6行代码）

公告