2016 年 3月 19 日随笔档案 - alex.shu

同时运行多个scrapy爬虫的几种方法（自定义scrapy项目命令）

摘要： Reference: http://www.cnblogs.com/rwxwsblog/p/4578764.html 试想一下，前面做的实验和例子都只有一个spider。然而，现实的开发的爬虫肯定不止一个。既然这样，那么就会有如下几个问题：1、在同一个项目中怎么创建多个爬虫的呢？2、多个爬虫的时候是阅读全文

posted @ 2016-03-19 21:02 alex.shu 阅读(7217) 评论(0) 推荐(2) 编辑

利用Linux命令行进行文本按行去重并按重复次数排序

摘要：利用Linux命令行进行文本按行去重并按重复次数排序 linux命令行提供了非常强大的文本处理功能，组合利用linux命令能实现好多强大的功能。本文这里举例说明如何利用Linux命令行进行文本按行去重并按重复次数排序。主要用到的命令有sort，uniq和cut。其中，sort主要功能是排序，uniq 阅读全文

posted @ 2016-03-19 12:01 alex.shu 阅读(3989) 评论(0) 推荐(0) 编辑

Python爬虫框架Scrapy安装使用步骤

摘要：一、爬虫框架Scarpy简介Scrapy 是一个快速的高层次的屏幕抓取和网页爬虫框架，爬取网站，从网站页面得到结构化的数据，它有着广泛的用途，从数据挖掘到监测和自动测试，Scrapy完全用Python实现，完全开源，代码托管在Github上，可运行在Linux，Windows，Mac和BSD平台上，阅读全文

posted @ 2016-03-19 01:43 alex.shu 阅读(4476) 评论(0) 推荐(0) 编辑

alex.shu

同时运行多个scrapy爬虫的几种方法（自定义scrapy项目命令）

利用Linux命令行进行文本按行去重并按重复次数排序

Python爬虫框架Scrapy安装使用步骤

导航

公告