会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
代码改变世界
Cnblogs
Dashboard
Login
Home
Contact
Gallery
Subscribe
RSS
OnSorrow+=new EventHandler(smile)
侧耳倾听
Nutch代码分析之1(Hadoop和creative commons)
2006-09-25 17:38
cppguy
阅读(
842
) 评论(
0
)
编辑
收藏
举报
Hadoop
是 Google labs 的
MapReduce
的一个实现,
Nutch项目
的全部数据处理都构建在其之上。MapReduce是一种简化的分布式编程模式,让程序可以自动在普通机器组成的集群中以并行方式分布执行。
就如同java程序员可以不考虑内存泄露一样,MapReduce程序员也不许要关心海量数据如何被分配到多台机器上,不需要考虑机器失效的处理,不需要考虑这些机器间如何协作共同完成工作,程序员不需要什么并发处理或者分布式系统的经验,就可以进行分布式的编程。
刷新页面
返回顶部
About