08 2021 档案
就业生态解析篇——数据预处理代码部分
摘要:连接爬取到的存储在MySQL种的数据,在该部分不展示。 data = data[data.job_name.str.contains('数据')]# 工作名是否含有数据 # 月薪 import re def salary_deal(text): if '万/月' in text: unit = 10 阅读全文
posted @ 2021-08-25 22:30 cookie的笔记簿 阅读(121) 评论(0) 推荐(0)
爬取51job招聘信息(一)
摘要:目标,将网页上的内容爬取下来,并实现翻页,存储为csv。 import os from concurrent.futures.thread import ThreadPoolExecutor from threading import Thread import requests from re i 阅读全文
posted @ 2021-08-16 20:41 cookie的笔记簿 阅读(386) 评论(0) 推荐(0)