import requests
import re
import csv
url = 'https://movie.douban.com/top250?start=0&filter='
for i in range(0,226,25):
url = f'https://movie.douban.com/top250?start={i}&filter='
headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/90.0.4430.93 Safari/537.36'}
resp = requests.get(url=url,headers = headers)
page_content = resp.text
resp.close()
obj = re.compile(r'<li>.*?<div class="item">.*? <span class="title">(?P<name>.*?)</span>'
r'.*?<br>(?P<year>.*?) '
r'.*?<span class="rating_num" property="v:average">(?P<score>.*?)</span>',re.S)
result = obj.finditer(page_content)
f = open('date.csv',mode='a+',newline='')
csvwrite = csv.writer(f)
for i in result:
dic = i.groupdict()
dic['year'] = dic['year'].strip()
csvwrite.writerow(dic.values())
print('over!!')
f.close()
print('爬取完毕!~~')
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】凌霞软件回馈社区,博客园 & 1Panel & Halo 联合会员上线
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】博客园社区专享云产品让利特惠,阿里云新客6.5折上折
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 一个费力不讨好的项目,让我损失了近一半的绩效!
· 清华大学推出第四讲使用 DeepSeek + DeepResearch 让科研像聊天一样简单!
· 实操Deepseek接入个人知识库
· CSnakes vs Python.NET:高效嵌入与灵活互通的跨语言方案对比
· Plotly.NET 一个为 .NET 打造的强大开源交互式图表库