摘要:
1.1 yarn(分布式资源管理器) 1.1.1 yarn是什么? yarn是MapReduce第二代,将jobtracker重构呈功能分离成单独的组件。Yarn可以看作一个集群操作系统,他为应用程序提供了基本的服务来更好的利用大的、动态的、并行的基础设施资源。用任何语言编写的应用程序都能顺利用任意 阅读全文
摘要:
1.1 zookeeper(分布式协作服务) ZooKeeper是一个分布式的,开放源码的分布式应用程序协调服务,是Google的Chubby一个开源的实现,它是集群的管理者,监视着集群中各个节点的状态根据节点提交的反馈进行下一步合理操作。最终,将简单易用的接口和性能高效、功能稳定的系统提供给用户。 阅读全文
摘要:
1.1 机器学习的分类 1.1.1 监督学习 定义:从成对的已经标记好的输入和输出经验数据作为一个输入进行学习,用来预测输出结果,是从有正确答案的例子中学习。 任务分类 定义:将数据映射到预先定义的群组或类(历史数据的特征)。算法要求基于数据属性值来定义类别,把具体某些特征的数据项映射到给定的某个类 阅读全文