摘要:
连接爬取到的存储在MySQL种的数据,在该部分不展示。 data = data[data.job_name.str.contains('数据')]# 工作名是否含有数据 # 月薪 import re def salary_deal(text): if '万/月' in text: unit = 10 阅读全文
摘要:
目标,将网页上的内容爬取下来,并实现翻页,存储为csv。 import os from concurrent.futures.thread import ThreadPoolExecutor from threading import Thread import requests from re i 阅读全文
摘要:
part1数据探索及数据处理 数据探索 import pandas as pd # 导入数据集 df = pd.read_excel("~/user_orders.xlsx") # 查看前五行 print('查看前五行:',df.head()) 查看前五行: id name gender age e 阅读全文