爬虫之爬取豆瓣电影的名字
import requests #requests模块用于发送HTTP请求 import json #json模块用于对JSON数据进行编解码 #新建数组用于存放多个电影数据 movielist=[] #浏览器演示json crawlSite="https://api.douban.com/v2/movie/in_theaters" #像豆瓣发送请求并得到响应 res = requests.get(crawlSite) #对响应进行编码转换,忽略编码错误 data = res.content.decode("utf-8","ignore") #将Json对象转化为Python字典 data_dict = json.loads(data) #获取返回数据中的电影主题数据 movielist = data_dict['subjects'] #新建一个数组,存放电影名称 movieNameList=[] #通过遍历movielist这个数组,得到各个电影的名称,并且存放到movieNameList这个数组中 for i in range(len(movielist)): #通过movielist[i]['title']获取电影的名称 #通过append将名称加入到movieNameList数组中 #movieNameList.append(movielist[i]['title']) movieNameList.append(movielist[i]['title']+'==='+str(movielist[i]['rating']['average'])) #将结果打印输出 print(movieNameList)