摘要: 最近好懒,好久没写文章了。看到这篇关于大数据的文章,无论如何也要转载一下。随着BIG DATA大数据概念逐渐升温,如何搭建一个能够采集海量数据的架构体系摆在大家眼前。如何能够做到所见即所得的无阻拦式采集、如何快速把不规则页面结构化并存储、如何满足越来越多的数据采集还要在有限时间内采集。这篇文章结合我们自身项目经验谈一下。基本的例子我们来看一下作为人是怎么获取网页数据的呢?1、打开浏览器,输入网址u... 阅读全文
posted @ 2013-09-05 00:12 test.cfs 阅读(181) 评论(0) 推荐(0) 编辑