02 2017 档案

摘要:PS: 1、爬取的内容里面还有链接没有处理干净,虽然别人给了个源码,但是自己看不懂!(还要加油!↖(^ω^)↗↖(^ω^)↗) 2、视频里面说要模拟浏览器登入,但是我这里没有模拟还是可以正常的爬取(我用的是Python3) 阅读全文
posted @ 2017-02-11 19:53 睚一 阅读(1944) 评论(0) 推荐(0) 编辑
摘要:1 import urllib.request 2 import re 3 4 5 def get_html(page): #获取网页的HTML 6 url = 'http://search.51job.com/jobsearch/search_result.php?fromJs=1&jobarea=000000%2C00&district... 阅读全文
posted @ 2017-02-05 21:31 睚一 阅读(4064) 评论(0) 推荐(0) 编辑