小魏同学呀

园龄：4年粉丝：2 关注：0

python 获取豆瓣排名

import requests
from bs4 import BeautifulSoup
import openpyxl
def gethtmltext(url):
    try:
        header={
                'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3947.100 Safari/537.36'
        }#假如头信息不是游览器会被阻止访问
        r=requests.get(url, headers = header);
        r.raise_for_status();#如果状态码不是200就会报错
        r.encoding=r.apparent_encoding;
        return r.text;#截取前1000个字符[:1000]
    except:
        return "异常"
def select(url):
    arr=[]
    demo=gethtmltext(url)
    soup=BeautifulSoup(demo,"html.parser")
    all_soup=soup.find_all("div",class_="info")
    for each in all_soup:
        mov = each.span.text
        href = each.a['href']
        act = each.p.text
        fraction = each.find("span", class_="rating_num").text
        try:
            pinglun=each.find("span",class_="inq").text
        except:
            pinglun=''
        arr.append([mov, href, act, fraction, pinglun])
    print(arr)
    return arr

def save(arr):
    wb=openpyxl.Workbook()
    ws=wb.active
    ws['A1']="电影名称"
    ws['B1']="链接"
    ws['C1']="演员"
    ws['D1']="评分"
    ws['E1']="评论"
    for each in arr:
        ws.append(each)
    wb.save("豆瓣排名11.xlsx")
if __name__ == "__main__":
    result=[]
    for i in range(0,250,25):
        url = "https://movie.douban.com/top250?start={}&filter=".format(i)
        arr=select(url)
        result.extend(arr)
    save(result)

上一篇冒泡排序

本文作者：小魏同学呀

本文链接：https://www.cnblogs.com/weitongxue/p/14663794.html

版权声明：本作品采用知识共享署名-非商业性使用-禁止演绎 2.5 中国大陆许可协议进行许可。

posted @ 2021-04-15 18:09 小魏同学呀阅读(47) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

【推荐】还在用 ECharts 开发大屏？试试这款永久免费的开源 BI 工具！
【推荐】国内首个AI IDE，深度理解中文开发场景，立即下载体验Trae
【推荐】编程新体验，更懂你的AI，立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包，你的智能百科全书，全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell：AI 加持，快人一步

随笔：75
文章：0
评论：5
阅读：12393

公告

昵称：小魏同学呀
园龄： 4年
粉丝： 2
关注： 0

<

2025年3月

>

日

一

二

三

四

五

六

23

24

25

26

27

28

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

1

2

3

4

5

最新随笔

随笔分类

随笔档案

阅读排行榜

评论排行榜

1. 冒泡排序(5)

推荐排行榜

最新评论

1. Re:冒泡排序
@小魏同学呀 😃 test...
--靳太尚
2. Re:冒泡排序
@小魏同学呀测试...
--靳太尚
3. Re:冒泡排序
😅
--靳太尚
4. Re:冒泡排序
，
--靳太尚
5. Re:冒泡排序
😃
--小魏同学呀

1 Play AlanWalker
2 来迟戴羽彤

来迟 - 戴羽彤

00:00 / 00:00

An audio error has occurred, player will skip forward in 2 seconds.

戴羽彤 - 来迟

作词：卡文

作曲：三珊

编曲：筱明

制作人：一寸光年团队

吉他：老田

录音师：庄柏鑫

录音棚：33studio

和声：赫拉Hera

混音：张鸣利、黄俊@iPauL

制作公司：一寸光年

OP：一寸光年

「未经著作权人许可不得翻唱翻录或使用」

『酷狗音乐人 • 星曜计划』

全方位推广，见证星力量！

就好像是场隔世经年的梦

醒来我早已失去你的影踪

而曾经的我总是懵懵懂懂

最后才明白何为情之所钟

我提起一腔孤勇向你飞驰

想说出我刻在心上的名字

可你已经向新的航道行驶

那条船不再有我的位置

我这一次终究还是来得太迟

错过了你此后所有的故事

我酝酿好久却老得掉牙的诗

最后也没能拥有收信地址

我这一次终究还是来得太迟

不该出现再插上一点说辞

这本就是我一厢情愿的固执

只是该如何忘记你的名字

宛如像一首绵延不绝的诗

把你带走只留下一道影子

如果你已经拥有新的开始

我会忘记这一百种可是

我这一次终究还是来得太迟

错过了你此后所有的故事

我酝酿好久却老得掉牙的诗

最后也没能拥有收信地址

我这一次终究还是来得太迟

不该出现再插上一点说辞

这本就是我一厢情愿的固执

只是该如何忘记你的名字

终究还是来得太迟

错过了你此后所有的故事

我酝酿好久却老得掉牙的诗

最后也没能拥有收信地址

我这一次终究还是来得太迟

不该出现再插上一点说辞

这本就是我一厢情愿的固执

只是该如何忘记你的名字