pands 返回某一列出现次数最多的元素(即返回 value_counts() 统计个数后 series 结构中的最大值对应的索引)
业务场景:
招聘数据探索分析
1、读取数据并存为一个名叫job_info的据框。
2、将列命名为:['公司’,’岗位’,’工作地点’,’工资’,’发布日期]。
3、哪个岗位招聘需求最多?
4、取出9月3日发布的招聘信息。
5、找出工作地点在深圳的数据分析师招聘信息。
第三问哪个岗位招聘需求最多?首先用value_counts() 统计岗位这一列每个元素出现的个数,返回结果是Series
核心代码
goal = Series.idxmax()
示例
import pandas as pd
job_info = pd.read_csv('job_info.csv',header=None,names=('公司','岗位','工作地点','工资','发布日期'),encoding = 'gbk')
a = job_info.loc[:,'岗位'].value_counts() #统计岗位这一列每个元素出现的个数
b = a.idxmax() # 找出招聘需求最多的岗位
data_9_3 = job_info[job_info['发布日期'] == '09-03'] # 取出9月3日的招聘信息
data5 = job_info[(job_info['工作地点'] == '深圳') & (job_info['岗位'] == '数据分析师')] #找出工作地点在深圳的数据分析师招聘信息