爬虫之爬取豆瓣电影的名字

import requests    #requests模块用于发送HTTP请求
import json        #json模块用于对JSON数据进行编解码

#新建数组用于存放多个电影数据
movielist=[]

#浏览器演示json
crawlSite="https://api.douban.com/v2/movie/in_theaters"

#像豆瓣发送请求并得到响应
res = requests.get(crawlSite)

#对响应进行编码转换,忽略编码错误
data = res.content.decode("utf-8","ignore")

#将Json对象转化为Python字典
data_dict = json.loads(data)

#获取返回数据中的电影主题数据
movielist = data_dict['subjects']

#新建一个数组,存放电影名称
movieNameList=[]

#通过遍历movielist这个数组,得到各个电影的名称,并且存放到movieNameList这个数组中
for i in range(len(movielist)):
    #通过movielist[i]['title']获取电影的名称
    #通过append将名称加入到movieNameList数组中
    #movieNameList.append(movielist[i]['title'])
    movieNameList.append(movielist[i]['title']+'==='+str(movielist[i]['rating']['average']))

#将结果打印输出
print(movieNameList)
    

 

posted @ 2018-11-09 21:40  泰初  阅读(1142)  评论(0编辑  收藏  举报