摘要: # 1.把之间案例,使用bs4,正则,xpath,进行数据提取。 # 2.爬取拉钩网上的所有python职位。 from urllib import request,parse import json,random #导入xlsxwriter 主要用于生成excel表格对象 import xlsxwriter #创建python的职位类 class python_position: ... 阅读全文
posted @ 2018-03-11 22:00 Bob__Zhang 阅读(403) 评论(0) 推荐(0) 编辑
摘要: # 2.爬取拉钩网上的所有python职位。 from urllib import request,parse import json,random def user_agent(page): #浏览器列表,每次访问可以用不同的浏览器访问 user_agent_list = [ 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWeb... 阅读全文
posted @ 2018-03-11 19:10 Bob__Zhang 阅读(554) 评论(0) 推荐(0) 编辑