摘要: Github: "https://github.com/nnngu/LearningNotes" 制作爬虫的步骤 制作一个爬虫一般分以下几个步骤: 分析需求 分析网页源代码,配合开发者工具 编写正则表达式或者XPath表达式 正式编写 python 爬虫代码 效果预览 运行效果如下: ![][1] 阅读全文
posted @ 2018-02-03 22:03 nnngu 阅读(27025) 评论(4) 推荐(4) 编辑
摘要: 源代码: "https://github.com/nnngu/LagouSpider" 效果预览 ![][7] 思路 1、首先我们打开拉勾网,并搜索“java”,显示出来的职位信息就是我们的目标。 2、接下来我们需要确定,怎样将信息提取出来。 查看网页源代码,这时候发现,网页源代码里面找不到职位相关 阅读全文
posted @ 2018-02-03 06:41 nnngu 阅读(944) 评论(1) 推荐(4) 编辑