摘要: 我们的这个爬虫设计来爬取京东图书(jd.com)。 scrapy框架相信大家比较了解了。里面有很多复杂的机制,超出本文的范围。 1、爬虫spider tips: 1、xpath的语法比较坑,但是你可以在chrome上装一个xpath helper,轻松帮你搞定xpath正则表达式 2、动态内容,比如 阅读全文
posted @ 2016-11-16 21:02 扎心了老铁 阅读(4946) 评论(0) 推荐(0) 编辑
摘要: mongodb副本集模式由如下几部分组成: 1、路由实例mongos 2、配置实例configsvr 3、副本集集群replset(一主多从) tips: 1、以上实例都是mongod守护进程 2、以上实例应在同一网段 配置一个集群分两步:启动和配置。 1、启动 对于下面实例的管理,你可以将各个实例 阅读全文
posted @ 2016-11-16 20:18 扎心了老铁 阅读(1216) 评论(0) 推荐(0) 编辑