上一页 1 2 3 4 5 6 7 8 9 10 ··· 26 下一页
摘要: 随着Spark的逐渐成熟完善,越来越多的可配置参数被添加到Spark中来,本文试图通过阐述这其中部分参数的工作原理和配置思路,和大家一起探讨一下如何根据实际场合对Spark进行配置优化。由于篇幅较长,所以在这里分篇组织,如果要看最新完整的网页版内容,可以戳这里:http://spark-config... 阅读全文
posted @ 2015-09-08 17:35 暗痛 阅读(976) 评论(0) 推荐(0) 编辑
摘要: 随着Spark的逐渐成熟完善,越来越多的可配置参数被添加到Spark中来,本文试图通过阐述这其中部分参数的工作原理和配置思路,和大家一起探讨一下如何根据实际场合对Spark进行配置优化。由于篇幅较长,所以在这里分篇组织,如果要看最新完整的网页版内容,可以戳这里:http://spark-config... 阅读全文
posted @ 2015-09-08 17:34 暗痛 阅读(1548) 评论(0) 推荐(0) 编辑
摘要: 随着Spark的逐渐成熟完善, 越来越多的可配置参数被添加到Spark中来, 在Spark的官方文档http://spark.apache.org/docs/latest/configuration.html 中提供了这些可配置参数中相当大一部分的说明.但是文档的更新总是落后于代码的开发的, 还有一... 阅读全文
posted @ 2015-09-08 17:31 暗痛 阅读(1374) 评论(0) 推荐(0) 编辑
摘要: 随着Spark的逐渐成熟完善,越来越多的可配置参数被添加到Spark中来,本文试图通过阐述这其中部分参数的工作原理和配置思路,和大家一起探讨一下如何根据实际场合对Spark进行配置优化。由于篇幅较长,所以在这里分篇组织,如果要看最新完整的网页版内容,可以戳这里:http://spark-config... 阅读全文
posted @ 2015-09-08 17:30 暗痛 阅读(592) 评论(0) 推荐(0) 编辑
摘要: 引言相对Hadoop, Spark在处理需要迭代运算的机器学习训练等任务上有着很大性能提升,同时提供了批处理、实时数据处理、机器学习以及图算法等一站式的服务,因此最近大家一起来学习Spark,特别是MLLib。Spark中使用了RDD(Resilient Distributed Datasets, ... 阅读全文
posted @ 2015-09-08 15:48 暗痛 阅读(1810) 评论(0) 推荐(0) 编辑
摘要: Apache Mesos能够成为最优秀的数据中心资源管理器的一个重要功能是面对各种类型的应用,它具备像交警一样的疏导能力。本文将深入Mesos的资源分配内部, 探讨Mesos是如何根据客户应用需求,平衡公平资源共享的。在开始之前,如果读者还没有阅读这个系列的前序文章,建议首先阅读它们。第一篇是Mes... 阅读全文
posted @ 2015-09-07 16:36 暗痛 阅读(1328) 评论(0) 推荐(0) 编辑
摘要: 简介hadoop中的NameNode好比是人的心脏,非常重要,绝对不可以停止工作。在hadoop1时代,只有一个NameNode。如果该 NameNode数据丢失或者不能工作,那么整个集群就不能恢复了。这是hadoop1中的单点问题,也是hadoop1不可靠的表现,如图1所示。 hadoop2就解决... 阅读全文
posted @ 2015-09-06 17:29 暗痛 阅读(338) 评论(0) 推荐(0) 编辑
摘要: 第一部分 Hadoop 2.2 下载 Hadoop我们从Apache官方网站直接下载最新版本Hadoop2.2。官方目前是提供了linux32位系统可执行文件,所以如果需要在64位系统上部署则需要单独下载src源码自行编译(10楼评论中提供了一个解决方法链接)。下载地址:http://apa... 阅读全文
posted @ 2015-08-24 16:09 暗痛 阅读(166) 评论(0) 推荐(0) 编辑
摘要: ZooKeeper是一个分布式开源框架,提供了协调分布式应用的基本服务,它向外部应用暴露一组通用服务——分布式同步(Distributed Synchronization)、命名服务(Naming Service)、集群维护(Group Maintenance)等,简化分布式应用协调及其管理的难度,... 阅读全文
posted @ 2015-08-24 15:59 暗痛 阅读(245) 评论(0) 推荐(0) 编辑
摘要: ZooKeeper是一个分布式的,开放源码的分布式应用程序协调服务,它包含一个简单的原语集,分布式应用程序可以基于它实现同步服务,配置维护和命名服务等。Zookeeper是hadoop的一个子项目,其发展历程无需赘述。在分布式应用中,由于工程师不能很好地使用锁机制,以及基于消息的协调机制不适合在某些... 阅读全文
posted @ 2015-08-24 15:13 暗痛 阅读(187) 评论(0) 推荐(0) 编辑
上一页 1 2 3 4 5 6 7 8 9 10 ··· 26 下一页