摘要: 1: 利用urllib.request和正则表达式抓取职位信息,并写入本地文件 1 # coding:utf-8 2 3 import re 4 import requests 5 import urllib.request 6 7 #利用urllib和re正则提取网页数据 8 9 ''' 10 u 阅读全文
posted @ 2020-04-08 09:19 MorePrograms 阅读(376) 评论(0) 推荐(0) 编辑
摘要: 1: 用户代理池和IP代理池混合方式,爬取51job职位信息 1 # coding:utf-8 2 import urllib.request 3 import urllib.error 4 import re 5 import random 6 from ua_proxyip_common imp 阅读全文
posted @ 2020-04-08 09:10 MorePrograms 阅读(371) 评论(0) 推荐(0) 编辑