python 爬去拉钩测试招聘信息

代码如下:

 

复制代码
 1 #coding:utf-8
 2 import time
 3 import urllib.request
 4 from bs4 import BeautifulSoup
 5 file=open(r'meituancde.txt','w')
 6 def get_url(i):
 7     url='https://www.lagou.com/zhaopin/ceshi/%s/?filterOption=%s'%(i,i)
 8     return url
 9 def get_html(i):
10     headers={
11         'User-Agent':'Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/56.0.2924.87 Safari/537.36'
12         }
13     response=urllib.request.Request(url=get_url(i),headers=headers)
14     html=urllib.request.urlopen(response).read().decode('utf-8')
15     sopu=BeautifulSoup(html)
16     return sopu
17 def parse(i):
18     soup=get_html(i)
19     me=soup.findAll('',{'class':'money'}) #工资
20     me1=soup.findAll('',{'class':'format-time'})#发布时间
21     me2=soup.findAll('',{'class':'li_b_r'})#福利
22     me3=soup.findAll('',{'data-lg-tj-id':'8F00'})#公司名字
23     meitu={}
24     i=0
25     for title in me:
26         meitu['gongzi'] =me[i].text
27         for jianjie in me1:
28             meitu['发布时间']=me1[i].text
29             for sellum in me2:
30                 meitu['福利']=me2[i].text
31                 for pire in me3:
32                     meitu['公司名称']=me3[i].text
33         i+=1
34         print(meitu)
35         if len(meitu) !=0:
36             file.write(str(meitu))
37             file.write("\n")
38             file.close
39 if __name__ == '__main__':
40     for i in range(1,31):
41 parse(i)

复制代码

结果图:

 

posted @   北漂的雷子  阅读(730)  评论(3编辑  收藏  举报
编辑推荐:
· 如何编写易于单元测试的代码
· 10年+ .NET Coder 心语,封装的思维:从隐藏、稳定开始理解其本质意义
· .NET Core 中如何实现缓存的预热?
· 从 HTTP 原因短语缺失研究 HTTP/2 和 HTTP/3 的设计差异
· AI与.NET技术实操系列:向量存储与相似性搜索在 .NET 中的实现
阅读排行:
· 周边上新:园子的第一款马克杯温暖上架
· Open-Sora 2.0 重磅开源!
· 分享 3 个 .NET 开源的文件压缩处理库,助力快速实现文件压缩解压功能!
· Ollama——大语言模型本地部署的极速利器
· DeepSeek如何颠覆传统软件测试?测试工程师会被淘汰吗?
点击右上角即可分享
微信分享提示