2019年10月30日

scrapy

摘要: __author__ = 'Administrator' # -*- encoding:utf-8 -*- import scrapy class QuoteSpider(scrapy.Spider): name = 'poxiao' start_urls=['https://www.poxiao. 阅读全文

posted @ 2019-10-30 16:10 土豆爸 阅读(277) 评论(0) 推荐(0) 编辑

xpath

摘要: XPath,全称XML Path Language,即XML路径语言,它是一门在XML文档中查找信息的语言。它最初是用来搜寻XML文档的,但是它同样适用于HTML文档的搜索。 所以在做爬虫时,我们完全可以使用XPath来做相应的信息抽取。本节中,我们就来介绍XPath的基本用法。 1. XPath概 阅读全文

posted @ 2019-10-30 15:52 土豆爸 阅读(302) 评论(0) 推荐(0) 编辑

导航