摘要: 在 Linux 操作系统下,几乎所有的软件均通过RPM 进行安装、卸载及管理等操作。RPM 的全称为Redhat Package Manager ,是由Redhat 公司提出的,用于管理Linux 下软件包的软件。Linux 安装时,除了几个核心模块以外,其余几乎所有的模块均通过RPM 完成安装。R 阅读全文
posted @ 2017-04-27 17:37 jason_zhangz 阅读(1271) 评论(0) 推荐(0) 编辑
摘要: 在实际应用中,我们会遇到各式各样的数据库如nosql非关系数据库(memcached,redis,mangodb),RDBMS关系数据库(oracle,mysql等),还有一些其它的数据库如hbase,在这些数据库中,又会出现结构化数据,非结构化数据,半结构化数据,下面列出各种数据类型: 结构化数据 阅读全文
posted @ 2017-04-27 12:01 jason_zhangz 阅读(602) 评论(0) 推荐(0) 编辑
摘要: 大数据是收集、整理、处理大容量数据集,并从中获得见解所需的非传统战略和技术的总称。虽然处理数据所需的计算能力或存储容量早已超过一台计算机的上限,但这种计算类型的普遍性、规模,以及价值在最近几年才经历了大规模扩展。 本文将介绍大数据系统一个最基本的组件:处理框架。处理框架负责对系统中的数据进行计算,例 阅读全文
posted @ 2017-04-27 10:56 jason_zhangz 阅读(323) 评论(0) 推荐(0) 编辑
摘要: 浅谈Hive vs. HBase 区别在哪里 浅谈Hive vs. HBase 区别在哪里 导读:Apache Hive是一个构建于Hadoop(分布式系统基础架构)顶层的数据仓库,Apache HBase是运行于HDFS顶层的NoSQL(=Not Only SQL,泛指非关系型的数据库)数据库系统 阅读全文
posted @ 2017-04-27 10:37 jason_zhangz 阅读(266) 评论(0) 推荐(0) 编辑