摘要:
Kafka是什么 Kafka是由LinkedIn开发的一个分布式的消息系统,使用Scala编写,是一种消息中间件 为什么要使用Kafka – 解耦、冗余、提高扩展性、缓冲 – 保证顺序,灵活,削峰填谷 – 异步通信 Kafka角色与集群结构 – producer:生产者,负责发布消息 – consu 阅读全文
摘要:
hadoop定义 Hadoop 是一个能够对大量数据进行分布式处理的软件框架,是一款开源软件,使用JAVA开发,Hadoop被公认是一套行业大数据标准开源软件,在分布式环境下提供了海量数据的处理能力。 什么是大数据 ? 大数据指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,需要新 阅读全文