开课吧--Python数据分析--第3节 再见Excel,你好Pandas!--互动练习:进军好莱坞
题目要求
在这个练习中,我们会读取好莱坞电影信息的csv文件,并统计出数据集中共有多少个导演。
题目讲解
1. 电影信息存储在csv中,路径为/data/course_data/data_analysis/movie_data.csv
2. 获取导演名字信息并算出一共多少个导演。
书写代码
import pandas as pd
df = pd.read_csv('/data/course_data/data_analysis/movie_data.csv')
mylist = df['director_name'].tolist() # DataFrame的director_name列转换成列表
len(set(mylist)) # 列表允许重复值,转换成集合可以去重