pandas + jupyter进行数据处理

1|0前言

上一篇文章已经将python所有职位的数据全部爬取并保存了下来,接下来我们要进行数据的处理,从所有的python职位中筛选出有测试、开发、运维的关键字职位来进行对比分析python在开发、测试、运维中的使用程度,具体的关键字大家可以灵活选择。此文章只提供一种处理方法或思路,并不适用任何场景。

2|0安装

anaconda安装

官网地址:https://www.anaconda.com/products/individual

它内部已经集成pandas、jupyter等一系列数据分析的开源库

image-20210101161855135

3|0数据处理

打开jupyter,开始编码

import pandas as pd
work = pd.read_csv('job.csv',encoding='gbk')
pd.read_csv('job.csv',encoding='gbk')

image-20210101175145807

wk = work.sort_index(ascending=True) #排序
DevOps = wk[wk['zhiwei'].str.contains('运维')] #部分匹配关键字
test = wk[wk['zhiwei'].str.contains('测试')]
dev = wk[wk['zhiwei'].str.contains('开发')]
data = wk[wk['zhiwei'].str.contains('数据')]
data.shape[0] #查看列表的总行数
DevOps.shape[0]
dev.shape[0]
DevOps_to = DevOps['zhiwei'] #匹配zhiwei行的数据
test_to = test['zhiwei']
dev_to = dev['zhiwei']
data_to = data['zhiwei']
DevOps_to.to_csv('devops.csv') #保存数据到新的csv
test_to.to_csv('test.csv')
dev_to.to_csv('dev.csv')
data_to.to_csv('data.csv')

从下面的编码和结果已经看出开发、运维、测试、数据岗位使用python

的数量。(因为进行了地区和学历以及工作年限的筛选所以总体的数据量不是很大。)数据:43,运维:47,开发:103,测试:54,虽然这些数据不能完全说明整体的情况,但依然也有部分参考的价值。

image-20210101175449596

当然这些数据也都保存到了csv文本里。

image-20210101180104130

image-20210101180526428


__EOF__

本文作者Harry
本文链接https://www.cnblogs.com/harry66/p/14220527.html
关于博主:评论和私信会在第一时间回复。或者直接私信我。
版权声明:本博客所有文章除特别声明外,均采用 BY-NC-SA 许可协议。转载请注明出处!
声援博主:如果您觉得文章对您有帮助,可以点击文章右下角推荐一下。您的鼓励是博主的最大动力!
posted @   Harry_666  阅读(1135)  评论(0编辑  收藏  举报
编辑推荐:
· AI与.NET技术实操系列(二):开始使用ML.NET
· 记一次.NET内存居高不下排查解决与启示
· 探究高空视频全景AR技术的实现原理
· 理解Rust引用及其生命周期标识(上)
· 浏览器原生「磁吸」效果!Anchor Positioning 锚点定位神器解析
阅读排行:
· DeepSeek 开源周回顾「GitHub 热点速览」
· 物流快递公司核心技术能力-地址解析分单基础技术分享
· .NET 10首个预览版发布:重大改进与新特性概览!
· AI与.NET技术实操系列(二):开始使用ML.NET
· 单线程的Redis速度为什么快?
点击右上角即可分享
微信分享提示