动态数据加载爬取

爬取豆瓣动态加载的数据内容:

在写程序之前先要提取出动态加载数据的所在url和param

通常情况下直接ctrl+f 进行全局搜索

demo:

url = 'https://movie.douban.com/j/chart/top_list'
params = {
    'type': '5',
    'interval_id': '100:90',
    'action': '',
    'start': '0',
    'limit': '20'
}
response = requests.get(url=url, params=params, headers=headers)
page_html = response.json()
for movie in page_html:
    name = movie['title']
    score = movie['score']
    print(name, score)

结果:

 

 有些动态加载的数据在全局搜索无法找到时,数据可能进行了加密等操作,后续更新然后破解加密的数据。

posted @ 2022-07-02 22:55  nLesxw  阅读(40)  评论(0编辑  收藏  举报