爬虫任务的多窗口切换
摘要:首先说一下Google浏览器网页检查里的元素邮件有一个copy >XPath选项,之前一直不知道这个东西是用来干嘛的,直到今日因为一个日常任务被我逮着了; 它可用于爬虫里的一个方法进行元素定位获取到该元素: // /html/body/div/div/div[1]/div[1] // /html/b
阅读全文
posted @
2017-08-23 17:15
断剑重铸之时
阅读(335)
推荐(0) 编辑
AMQP
摘要:AMQP协议是一个高级抽象层消息通信协议,RabbitMQ是AMQP协议的实现。 //TODO https://juejin.im/entry/599a91c0f265da248e75573a?utm_source=gold_browser_extension
阅读全文
posted @
2017-08-17 18:05
断剑重铸之时
阅读(166)
推荐(0) 编辑
字典文件读取
摘要:/** * 词工具 * */ public class WordUtil { private final static Logger logger = LoggerFactory.getLogger(WordUtil.class); public static Map> synonymMap = Maps.newHashMap(); public static Ma...
阅读全文
posted @
2017-08-11 11:31
断剑重铸之时
阅读(498)
推荐(0) 编辑
管道模式
摘要:挺不错的一个设计模式,先记下来以便以后哪里可以用到: 接口:数据处理管道的阀门(处理器): 对应实现类: 接口:数据处理管道: 对应实现类: 代码: public class DataPipelineImpl implements DataPipeline{ private List<DataVal
阅读全文
posted @
2017-08-11 10:10
断剑重铸之时
阅读(560)
推荐(0) 编辑