摘要: 什么是分布式系统 之前我有篇文章已经简单介绍了分布式通信,有兴趣的朋友可以去看看: 大型网站系统架构实践(二)分布式模块之间的通信 那么今天我详细的说下我对java分布式系统通信的理解 1.集群模式,将相同应用模块部署多份 2.业务拆分模式,将业务拆分成多个模块,并分别部署 3.存储分布式 由于分布 阅读全文
posted @ 2017-03-01 16:39 皇问天 阅读(3184) 评论(0) 推荐(0) 编辑
摘要: 需要下载jsoup-1.8.1.jar包 jsoup 是一款Java 的HTML解析器,可直接解析某个URL地址、HTML文本内容。它提供了一套非常省力的API,可通过DOM,CSS以及类似于jQuery的操作方法来取出和操作数据。 网页获取和解析速度飞快,推荐使用。主要功能如下: 1. 从一个UR 阅读全文
posted @ 2017-03-01 15:58 皇问天 阅读(1359) 评论(3) 推荐(0) 编辑
摘要: 什么是网络爬虫? 网络爬虫又叫蜘蛛,网络蜘蛛是通过网页的链接地址来寻找网页,从网站某一个页面(通常是首页)开始,读取网页的内容,找到在网页中的其它链接地址,然后通过这些链接地址寻找下一个网页,这样一直循环下去,直到把这个网站所有的网页都抓取完为止。如果把整个互联网当成一个网站,那么网络蜘蛛就可以用这 阅读全文
posted @ 2017-03-01 15:32 皇问天 阅读(14289) 评论(0) 推荐(1) 编辑