scrapy直接取出文章所有内容

示例：

import scrapy
from firstscrapy.items import CnblogsMysqlItem


class CnblogsSpider(scrapy.Spider):
    name = 'cnblogs'
    allowed_domains = ['www.cnblogs.com']
    # start_urls = ['http://www.cnblogs.com/']
    start_urls = ['http://www.cnblogs.com/lifei01/p/13440458.html']

    def parse(self, response):
        article = response.css('#main')
        print(article.css('#cb_post_title_url span::text').extract_first())
        article_body = response.xpath('.//div[@id="cnblogs_post_body"]//text()').extract()
        for line in article_body:
            print(line.strip())

posted @ 2020-08-05 23:42 耗油炒白菜阅读(127) 评论(0) 收藏举报

刷新页面返回顶部

耗油炒白菜

scrapy直接取出文章所有内容

公告