Fork me on GitHub

用BeautifulSoup简单爬取BOSS直聘网岗位

用BeautifulSoup简单爬取BOSS直聘网岗位

  • 爬取python招聘
import requests
from bs4 import BeautifulSoup

def fun(path):
    r1 = requests.get(url=path,
                      headers = {'user-agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.25 Safari/537.36 Core/1.70.3676.400 QQBrowser/10.4.3469.400'},
                      )
    soup = BeautifulSoup(r1.text,'html.parser')
    div = soup.find(name='div',id='main')
    info  = div.find(name='div',attrs={'class':'job-list'})
    li = info.find_all(name='li')
    f = open('boss直聘.txt','a',encoding='utf-8')
    for i in li:
        job = i.find(name='div',attrs={'class':'job-title'})
        red = i.find(name='span',attrs={'class':'red'})
        company = i.find_all(name="a")
        em = i.find_all(name='p')

        info = "%s|%s|%s|%s|%s"%(job.text,red.text,em[0].text,em[1].text,company[1].text)
        f.write(info+'\n')
    f.close()
for i in range(1,11):
    path = 'https://www.zhipin.com/c101010100-p100109/?page=%d&ka=page-%d'%(i,i)
    fun(path)

此代码仅供学习使用。

posted @   是阿凯啊  阅读(685)  评论(0编辑  收藏  举报
编辑推荐:
· Linux系列:如何用 C#调用 C方法造成内存泄露
· AI与.NET技术实操系列(二):开始使用ML.NET
· 记一次.NET内存居高不下排查解决与启示
· 探究高空视频全景AR技术的实现原理
· 理解Rust引用及其生命周期标识(上)
阅读排行:
· 物流快递公司核心技术能力-地址解析分单基础技术分享
· .NET 10首个预览版发布:重大改进与新特性概览!
· 单线程的Redis速度为什么快?
· 展开说说关于C#中ORM框架的用法!
· Pantheons:用 TypeScript 打造主流大模型对话的一站式集成库
点击右上角即可分享
微信分享提示