Python 爬虫 获取标签下面的子标签

thr_msgs = soup.find_all('div',class_=re.compile('msg'))

for i in thr_msgs:
    print(i)
    first = i.select('em:nth-of-type(1)')
    print(first)



>>>

<div class='\"msg\"'><em>佛山</em><em>1-3年</em><em>大专</em></div>
[<em>佛山</em>]
<div class='\"msg\"'><em>南京</em><em>3-5年</em><em>本科</em></div>
[<em>南京</em>]
<div class='\"msg\"'><em>南阳</em><em>1-3年</em><em>大专</em></div>
[<em>南阳</em>]
<div class='\"msg\"'><em>深圳</em><em>1年以内</em><em>本科</em></div>
[<em>深圳</em>]

>>>

需要下载代码的可以到我的GitHub上下载 https://github.com/FightingBob/-Web-Crawler-training  如果觉得可以,请给我颗star鼓励一下,谢谢!

  

posted @ 2018-06-24 10:51  littlebob  阅读(9935)  评论(0编辑  收藏  举报