就业生态解析篇——数据预处理代码部分
摘要:连接爬取到的存储在MySQL种的数据,在该部分不展示。 data = data[data.job_name.str.contains('数据')]# 工作名是否含有数据 # 月薪 import re def salary_deal(text): if '万/月' in text: unit = 10
阅读全文
posted @
2021-08-25 22:30
cookie的笔记簿
阅读(94)
推荐(0) 编辑
爬取51job招聘信息(一)
摘要:目标,将网页上的内容爬取下来,并实现翻页,存储为csv。 import os from concurrent.futures.thread import ThreadPoolExecutor from threading import Thread import requests from re i
阅读全文
posted @
2021-08-16 20:41
cookie的笔记簿
阅读(334)
推荐(0) 编辑