老白条 - 博客园

2016年7月1日

摘要： teradata培训文档 http://wenku.baidu.com/view/ec44c201cc175527072208ba.html Teradata 和Greenplum 的讨论 http://www.itpub.net/forum.php?mod=viewthread&action=pr 阅读全文

posted @ 2016-07-01 10:00 老白条阅读(218) 评论(0) 推荐(0) 编辑

数据建模工具使用方法相关索引

摘要： ERwin应用以及使用示例 http://www.doc88.com/p-99993342255.html ERWin详细教程_百度文库 http://wenku.baidu.com/view/bc11524ef7ec4afe04a1dfdd.html ERwin Data Modeler 7.2反阅读全文

posted @ 2016-07-01 09:53 老白条阅读(245) 评论(0) 推荐(0) 编辑

数据仓库相关资料索引

摘要： http://www.itpub.net/thread-1320024-1-3.html 阅读全文

posted @ 2016-07-01 09:45 老白条阅读(121) 评论(0) 推荐(0) 编辑

2016年6月28日

MapReduce 1工作原理图文详解

摘要： MapReduce工作原理图文详解一 MapReduce程序执行流程程序执行流程图如下：流程分析：1.在客户端启动一个作业。2.向JobTracker请求一个Job ID。3.将运行作业所需要的资源文件复制到HDFS上，包括MapReduce程序打包的JAR文件、配置文件和客户端计算所得的输入阅读全文

posted @ 2016-06-28 16:17 老白条阅读(347) 评论(0) 推荐(0) 编辑

2016年6月27日

HDFS的常用操作

摘要： 1、创建目录命令 HDFS有一个默认的工作目录/user/$USER，其中$USER是用户的登录用户名。不过目录不会自动建立，需要mkdir建立它命令格式：hadoop fs -mkdir 如：在user目录下创建chen目录 hadoop fs -mkdir /user/chen 注意：Had 阅读全文

posted @ 2016-06-27 13:51 老白条阅读(417) 评论(0) 推荐(0) 编辑

HDFS 原理、架构与特性介绍

摘要：本文主要讲述 HDFS原理-架构、副本机制、HDFS负载均衡、机架感知、健壮性、文件删除恢复机制 1：当前HDFS架构详尽分析 HDFS架构 •NameNode •DataNode •Sencondary NameNode 数据存储细节 NameNode 目录结构 Namenode 的目录结构： $ 阅读全文

posted @ 2016-06-27 13:28 老白条阅读(690) 评论(0) 推荐(0) 编辑

2016年6月24日

SMP、NUMA、MPP体系结构介绍

摘要：认识 Numa 架构从系统架构来看，目前的商用服务器大体可以分为三类，即对称多处理器结构 (SMP ： Symmetric Multi-Processor) ，非一致存储访问结构 (NUMA ： Non-Uniform Memory Access) ，以及海量并行处理结构 (MPP ： Massi 阅读全文

posted @ 2016-06-24 16:53 老白条阅读(397) 评论(0) 推荐(0) 编辑

2016年6月6日

hive优化之------控制hive任务中的map数和reduce数

摘要：一、控制hive任务中的map数: 1. 通常情况下，作业会通过input的目录产生一个或者多个map任务。主要的决定因素有： input的文件总个数，input的文件大小，集群设置的文件块大小(目前为128M, 可在hive中通过set dfs.block.size;命令查看到，该参数不能自定阅读全文

posted @ 2016-06-06 13:29 老白条阅读(291) 评论(0) 推荐(0) 编辑

2016年5月3日

数据仓库的一些理解（原创）

摘要：概述数据仓库概念创始人W.H.Inmon在《建立数据仓库》一书中对数据仓库的定义是：数据仓库就是面向主题的、集成的、相对稳定的、随时间不断变化（不同时间）的数据集合，用以支持经营管理中的决策制定过程、数据仓库中的数据面向主题，与传统数据库面向应用相对应。主题导向(Subject-Oriented 阅读全文

posted @ 2016-05-03 17:31 老白条阅读(817) 评论(0) 推荐(0) 编辑

2016年4月20日

大数据真实电商数据仓库全流程开发详解

摘要：链接如下: http://www.chuanke.com/v1538386-116215-258987.html 阅读全文

posted @ 2016-04-20 14:57 老白条阅读(989) 评论(0) 推荐(0) 编辑

公告