02 2017 档案

摘要：PS： 1、爬取的内容里面还有链接没有处理干净，虽然别人给了个源码，但是自己看不懂！（还要加油！↖(^ω^)↗↖(^ω^)↗） 2、视频里面说要模拟浏览器登入，但是我这里没有模拟还是可以正常的爬取（我用的是Python3）阅读全文

posted @ 2017-02-11 19:53 睚一阅读(1944) 评论(0) 推荐(0) 编辑

摘要：1 import urllib.request 2 import re 3 4 5 def get_html(page): #获取网页的HTML 6 url = 'http://search.51job.com/jobsearch/search_result.php?fromJs=1&jobarea=000000%2C00&district... 阅读全文

posted @ 2017-02-05 21:31 睚一阅读(4064) 评论(0) 推荐(0) 编辑

02 2017 档案

公告