2017 年 11月 26 日随笔档案 - Charles.L

2017年11月26日

摘要：背景：刚开始学习scrapy爬虫框架的时候，就在想如果我在服务器上执行一个爬虫任务的话，还说的过去。但是我不能每个爬虫任务就新建一个项目吧。例如我建立了一个知乎的爬行任务，但是我在这个爬行任务中，写了多个spider，重要的是我想让他们同时运行，怎么办？小白解决办法： 1、在spiders同目录阅读全文

posted @ 2017-11-26 20:42 Charles.L 阅读(10724) 评论(1) 推荐(1) 编辑

python爬虫之scrapy的pipeline的使用

摘要： scrapy的pipeline是一个非常重要的模块，主要作用是将return的items写入到数据库、文件等持久化模块，下面我们就简单的了解一下pipelines的用法。案例一： items池 class ZhihuuserItem(scrapy.Item): # define the field 阅读全文

posted @ 2017-11-26 18:05 Charles.L 阅读(7532) 评论(0) 推荐(0) 编辑

pycharm远程linux开发和调试代码

摘要： pycharm是一个非常强大的python开发工具，现在很多代码最终在线上跑的环境都是linux，而开发环境可能还是windows下开发，这就需要经常在linux上进行调试，或者在linux对代码进行编写，而pycharm提供了非常便捷的方式。具体实现在windows上远程linux开发和调试的代码阅读全文

posted @ 2017-11-26 09:43 Charles.L 阅读(8092) 评论(0) 推荐(0) 编辑

Charles.L

人生苦短

公告