上一页 1 ··· 3 4 5 6 7 8 9 10 11 12 下一页
摘要: teradata培训文档 http://wenku.baidu.com/view/ec44c201cc175527072208ba.html Teradata 和Greenplum 的讨论 http://www.itpub.net/forum.php?mod=viewthread&action=pr 阅读全文
posted @ 2016-07-01 10:00 老白条 阅读(218) 评论(0) 推荐(0) 编辑
摘要: ERwin应用以及使用示例 http://www.doc88.com/p-99993342255.html ERWin详细教程_百度文库 http://wenku.baidu.com/view/bc11524ef7ec4afe04a1dfdd.html ERwin Data Modeler 7.2反 阅读全文
posted @ 2016-07-01 09:53 老白条 阅读(245) 评论(0) 推荐(0) 编辑
摘要: http://www.itpub.net/thread-1320024-1-3.html 阅读全文
posted @ 2016-07-01 09:45 老白条 阅读(121) 评论(0) 推荐(0) 编辑
摘要: MapReduce工作原理图文详解 一 MapReduce程序执行流程 程序执行流程图如下: 流程分析:1.在客户端启动一个作业。2.向JobTracker请求一个Job ID。3.将运行作业所需要的资源文件复制到HDFS上,包括MapReduce程序打包的JAR文件、配置文件和客户端计算所得的输入 阅读全文
posted @ 2016-06-28 16:17 老白条 阅读(347) 评论(0) 推荐(0) 编辑
摘要: 1、创建目录命令 HDFS有一个默认的工作目录/user/$USER,其中$USER是用户的登录用户名。不过目录不会自动建立,需要mkdir建立它 命令格式:hadoop fs -mkdir 如: 在user目录下创建chen目录 hadoop fs -mkdir /user/chen 注意:Had 阅读全文
posted @ 2016-06-27 13:51 老白条 阅读(417) 评论(0) 推荐(0) 编辑
摘要: 本文主要讲述 HDFS原理-架构、副本机制、HDFS负载均衡、机架感知、健壮性、文件删除恢复机制 1:当前HDFS架构详尽分析 HDFS架构 •NameNode •DataNode •Sencondary NameNode 数据存储细节 NameNode 目录结构 Namenode 的目录结构: $ 阅读全文
posted @ 2016-06-27 13:28 老白条 阅读(690) 评论(0) 推荐(0) 编辑
摘要: 认识 Numa 架构 从系统架构来看,目前的商用服务器大体可以分为三类,即对称多处理器结构 (SMP : Symmetric Multi-Processor) ,非一致存储访问结构 (NUMA : Non-Uniform Memory Access) ,以及海量并行处理结构 (MPP : Massi 阅读全文
posted @ 2016-06-24 16:53 老白条 阅读(397) 评论(0) 推荐(0) 编辑
摘要: 一、 控制hive任务中的map数: 1. 通常情况下,作业会通过input的目录产生一个或者多个map任务。 主要的决定因素有: input的文件总个数,input的文件大小,集群设置的文件块大小(目前为128M, 可在hive中通过set dfs.block.size;命令查看到,该参数不能自定 阅读全文
posted @ 2016-06-06 13:29 老白条 阅读(291) 评论(0) 推荐(0) 编辑
摘要: 概述 数据仓库概念创始人W.H.Inmon在《建立数据仓库》一书中对数据仓库的定义是:数据仓库就是面向主题的、集成的、相对稳定的、随时间不断变化(不同时间)的数据集合,用以支持经营管理中的决策制定过程、数据仓库中的数据面向主题,与传统数据库面向应用相对应。 主题导向(Subject-Oriented 阅读全文
posted @ 2016-05-03 17:31 老白条 阅读(817) 评论(0) 推荐(0) 编辑
摘要: 链接如下: http://www.chuanke.com/v1538386-116215-258987.html 阅读全文
posted @ 2016-04-20 14:57 老白条 阅读(989) 评论(0) 推荐(0) 编辑
上一页 1 ··· 3 4 5 6 7 8 9 10 11 12 下一页