摘要: flume -> kafka -> strom/spark -> HDFS/RIDS 1. flume: 接受7*24h的数据流,然后丢给storm/spark进行计算。 2. kafka: storm/spark可能来不及处理这些流水信息,这时需要kafka对数据进行缓存 3. hdfs/rids 阅读全文
posted @ 2016-04-25 15:51 人月神话vs 阅读(260) 评论(0) 推荐(0) 编辑
摘要: package-info.java对于经常使用外部包的程序员来说应该是熟悉陌生人。因为不是专门开发包的程序员很少需要关注它,而又常在其他包中看到他,眼很熟。它到底有哪些特性和作用及如何使用呢?程序员讲究动口不如动手,何不创建一个试试。打开Eclipse,new class,哦!创建失败,‘-’ 作为 阅读全文
posted @ 2016-04-23 21:09 人月神话vs 阅读(269) 评论(0) 推荐(0) 编辑
摘要: 一、什么是RPC 远程过程调用(RPC)是一个协议,程序可以使用这个协议使用网络中另一个服务器中某程序的服务,而不需要知道网络细节 二、RPC模型 . c/s模式 . 基于传输层协议,例如(tcp/ip) . 事件处理模型(请求、计算、响应) 三、RPC设计的目的 . 调用非本机的方法 . 不同语言 阅读全文
posted @ 2016-04-23 19:55 人月神话vs 阅读(134) 评论(0) 推荐(0) 编辑
摘要: 目前Apache Spark支持三种分布式部署方式,分别是standalone、spark on mesos和 spark on YARN,其中,第一种类似于MapReduce 1.0所采用的模式,内部实现了容错性和资源管理,后两种则是未来发展的趋势,部分容错性和资源管理交由统一的资源管理系统完成: 阅读全文
posted @ 2016-04-19 17:10 人月神话vs 阅读(632) 评论(0) 推荐(0) 编辑
摘要: cron cron表达式 阅读全文
posted @ 2016-04-15 17:55 人月神话vs 阅读(1215) 评论(0) 推荐(0) 编辑
摘要: <project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://maven.apache.org/P 阅读全文
posted @ 2016-04-15 17:53 人月神话vs 阅读(192) 评论(0) 推荐(0) 编辑