摘要: 一 Global Command 1 startproject https://docs.scrapy.org/en/latest/topics/commands.html#startproject 2 scrapy genspider -t basic baidu www.baidu.com ht 阅读全文
posted @ 2018-04-17 20:19 骑者赶路 阅读(92) 评论(0) 推荐(0) 编辑
摘要: 一 在爬取页面信息的过程中,需要到想要的信息进行定位,主要有两种方法。CSS选择器和XPath语言。查找某一个标签,两种方法都可以做到。 二 CSS选择器 http://www.w3school.com.cn/cssref/css_selectors.asp 伪类选择器 (a:hover) http 阅读全文
posted @ 2018-04-17 12:01 骑者赶路 阅读(124) 评论(0) 推荐(0) 编辑