如何使用Excel进行数据分析

实战案例:如何使用Excel进行数据分析

 

通过现有的招聘网站数据分析岗位信息,做一个简单的分析

问题:

1.数据分析岗位需求?

2.数据分析工资水平?

 

分析步骤:

1.理解数据

数据包含14个字段,城市和薪水字段是我们所需要的主要字段。教育要求,工作年限要求是细分字段,职位id 职位名称是我们核验记录的重要字段,工作所属领域可以判断所在行业

 

 

 2.数据清洗

  • 1.选择子集,数据量不大,暂不删除列
  • 2.列重命名,暂不需要
  • 3.删除重复值,一个职位id应该是唯一的,所以要去重
  • 4.缺失值处理,城市列存在缺失值,需要补全
  • 数据量很少,直接删除
  • 根据其他列的内容,推断出结果,手动填写
  • 如果是数值,可根据实际情况采用均值填写
  • 使用筛选功能,筛选出空值
  • 5.一致化处理
  • 公司所属领域 一列存在多个值,中间逗号分隔,不利于后期根系,需要拆成多列
  • 薪资 一列是文本型数据,而且是区间形式,不太好利用后期的计算,因此需要一致化处理成数字格式,最高薪水没有最大边界的,让最大值等于最小值,然后计算最值之间的平均值
  • 6.异常值处理
  • 职位一列 要删除掉不属于数据分析岗位的行

3.数据分析

1,数据分析师的行业需求,因为只选取了一个行业,没办法横向对比,这里选取地区,学历,职业,工作年限字段做筛选,得到我希望看到的结果。因为数据来源不可考,结果仅作为参考。

但是可以肯定的结论:随着工作时长的增长薪水也是增加的,学历对于数据分析也是正相关。

 

posted @ 2020-11-20 20:52  正在学Python  阅读(600)  评论(0编辑  收藏  举报