pands 返回某一列出现次数最多的元素（即返回 value_counts() 统计个数后 series 结构中的最大值对应的索引）

业务场景：

招聘数据探索分析
1、读取数据并存为一个名叫job_info的据框。
2、将列命名为：['公司’，’岗位’，’工作地点’，’工资’，’发布日期]。
3、哪个岗位招聘需求最多？
4、取出9月3日发布的招聘信息。
5、找出工作地点在深圳的数据分析师招聘信息。

第三问哪个岗位招聘需求最多？首先用value_counts() 统计岗位这一列每个元素出现的个数，返回结果是Series

在这里插入图片描述

核心代码

goal = Series.idxmax()

示例

 import pandas as pd
 
job_info = pd.read_csv('job_info.csv',header=None,names=('公司','岗位','工作地点','工资','发布日期'),encoding = 'gbk')
a = job_info.loc[:,'岗位'].value_counts()   #统计岗位这一列每个元素出现的个数
b = a.idxmax()  # 找出招聘需求最多的岗位
data_9_3 = job_info[job_info['发布日期'] == '09-03']    # 取出9月3日的招聘信息
data5 = job_info[(job_info['工作地点'] == '深圳') & (job_info['岗位'] == '数据分析师')]   #找出工作地点在深圳的数据分析师招聘信息

posted on 2021-06-09 19:04 雾恋过往阅读(1186) 评论(0) 编辑收藏举报

pands 返回某一列出现次数最多的元素（即返回 value_counts() 统计个数后 series 结构中的最大值对应的索引）

核心代码

示例

搜索

常用链接

随笔档案 (378)

阅读排行榜

评论排行榜

推荐排行榜

最新评论

	import pandas as pd

	job_info = pd.read_csv('job_info.csv',header=None,names=('公司','岗位','工作地点','工资','发布日期'),encoding = 'gbk')
	a = job_info.loc[:,'岗位'].value_counts() #统计岗位这一列每个元素出现的个数
	b = a.idxmax() # 找出招聘需求最多的岗位
	data_9_3 = job_info[job_info['发布日期'] == '09-03'] # 取出9月3日的招聘信息
	data5 = job_info[(job_info['工作地点'] == '深圳') & (job_info['岗位'] == '数据分析师')] #找出工作地点在深圳的数据分析师招聘信息