一:课程简介: HBase是云计算时代大数据技术的事实开源标准和技术,是和Google的Bigtable类似的技术,很多使用云计算技术的公司(尤其是搜索引擎公司和金融机构基于互联网公司)均会选在使用HBase技术,本课程从HBase集群的实际构建、HBase具体的开发实战、HBase的内部架构、HBase的运维管理以及HBase的优化等深入浅出的细致剖析,祝你轻松掌握HBase 二:课程特色 1, HBase集群的实际构建; 2, HBase具体的开发实战; 3, HBase的架构揭秘和剖析 4, HBase集群的管理; 5, HBase性能优化 三:适合对象: 软件工程师; 数据库开发人员; 网络后台开发人员; 运维人员; 四:基础要求 了解Linux系统; 了解网络; 了解Java; 五:讲师简介 王家林 Hadoop源码级专家,曾负责某知名公司的类H Read More
posted @ 2014-02-13 22:03 王家林的Hadoop之旅 Views(245) Comments(0) Diggs(0) Edit
一:课程简介: 或许Hive会是数据仓库的终结者…… 作为企业Hadoop应用的核心产品,Hive承载着FaceBook、淘宝等大佬 95%以上的离线统计,很多企业里的离线统计甚至全由Hive完成. Hive可以让你轻松的在Hadoop中存储、查询和分析海量数据。 二:课程特色 1, 深入浅出中动手实作; 2, 对Hive深入浅出的剖析; 3, 掌握Hive的优化技术; 4, Hive和亚马逊云计算 三:适合对象: 软件工程师; 数据库开发人员; 网络后台开发人员; 运维人员; 四:基础要求 了解Linux系统; 了解网络; 了解Java; 五:讲师简介 王家林: Hadoop源码级专家,曾负责某知名公司的类Hadoop框架开发工作,专注于Hadoop一站式解决方案的提供,同时也是云计算分布式大数据处理的最早实践者之一,Hadoop的狂热爱好者,不断的在实践中用Hadoop解决不同领域的大数据的高效处理和存储,现在正负责Hadoop在搜索引擎中的研发中国电信的多次Hadoop培训,花旗银行的Hadoop内训,金立手 Read More
posted @ 2014-02-13 22:00 王家林的Hadoop之旅 Views(283) Comments(0) Diggs(0) Edit
一:课程简介: 该来的终于来了,一股NoSQL革命正在席卷全球… 由于传统数据库越来越无法满足日益增长的海量数据的高效存储、访问以及高并发读写以及巨大的可扩展性等问题,传统的关系型数据库面临着巨大的调整,NoSQL应用而生。 NoSQL通过自身的架构和设计非常有效的解决了大数据量、高性能、高可用性、高度可扩展性等问题,并且在性能上具有革命性的优势,在众多的NoSQL中其中的MongoDB作为非关系型数据库中功能最为丰富、最像关系型数据库的最受欢迎,它具有高性能、易部署、易使用、存储和管理方便等诸多优势。 本课程从NoSQL揭秘开始,以实践为基础循序渐进的剖析NoSQL的方方面面,尤其是对MongoDB的剖析尤为深入实用。助力你成为NoSQL时代的弄潮儿。 二:课程特色 1, 深入浅出中动手实作; 2, 各种NoSQL的产品对比; 3, 深入剖析NoSQL的典型代表MongoDB 三:适合对象: 软件工程师; 数据库开发人员; Read More
posted @ 2014-02-13 21:58 王家林的Hadoop之旅 Views(255) Comments(0) Diggs(0) Edit
一:课程简介: Hadoop天生是解决大数据高并发问题的, 是一个能够对海量数据进行分布式处理的软件框架。互联网企业、金融机构、政府组织和云计算服务企业每天都会产生大量的数据并面临高并发的严峻考验,传统的关系型数据库已经无法满足大数据量高并发的要求,作为云计算实现规范和实施标准的Hadoop应运而生。 使用Hadoop,用户可以在不了解分布式底层细节的情况下开发出分布式程序,从而可以使用众多廉价的计算设备的集群的威力来高速的运算和存储,而且Hadoop的运算和存储是可靠的、高效的、可伸缩的,能够使用普通的社区服务器出来PB级别的数据,是分布式大数据处理的存储的理想选择。 “云计算分布式大数据Hadoop深入浅出案例驱动实战”基于实务经验萃取而成,从Hadoop开发环境的搭建到到图片服务器、WordCount实现、HBase微博系统、话单查询与统计、Hive数据统计案例、电商业日志流量分析项目理论结合实际案例,祝你轻松驾驭Hadoop以满足大数据的分布式处理与存储。 课程以MapReduce、HBase、Hive为主轴,想理解和使用Hadoop,就必须掌握这三大核 Read More
posted @ 2014-02-13 21:57 王家林的Hadoop之旅 Views(279) Comments(0) Diggs(0) Edit
一:课程简介: 首先从国内主要的云计算厂商系统比较和理解云计算架构等入手,然后细致剖析: Google的云计算 亚马逊的AWS 微软云计算平台Windows Azure VMware云计算 最后以实战技术:云计算动手实战---Hadoop结束; 让您理解云计算的基本概念、架构、工作机制;了解云计算的业务模式及其价值;结合业界云计算的发展,找出适合本企业云计算模式; 二:课程特色 1, 经典案例分析 ; 2, 国内外相互比较 3, 动手实践体验 三:适合对象: 软件工程师; 数据库开发人员; 网络后台开发人员; 运维人员; 四:基础要求 了解Linux系统; 了解网络; 了解Java; 五:讲师简介 Hadoop源码级专家,曾负责某知名公司的类Hadoop框架开发工作,专注于Hadoop一站式解决方案的提供,同时也是云计算分布式大数据处理的最早实践者之一,Hadoop Read More
posted @ 2014-02-13 21:56 王家林的Hadoop之旅 Views(238) Comments(0) Diggs(0) Edit
一:课程简介: 作为云计算实现规范和实施标准的Hadoop恰逢其时的应运而生,使用Hadoop用户可以在不了解分布式底层细节的情况下开发出分布式程序,从而可以使用众多廉价的计算设备的集群的威力来高速的运算和存储,而且Hadoop的运算和存储是可靠的、高效,的、可伸缩的,能够使用普通的社区服务器出来PB级别的数据,是分布式大数据处理的存储的理想选择。 本课程会助你深入浅出的掌握Hadoop开发(包括HDFS、MapReduce、HBase、Hive等),并且在此基础上掌握Hadoop集群的配置、维护、管理、监控、运维、测试、优化等主题,理论结合实际案例;助你轻松驾驭Hadoop以满足大数据的分布式处理与存储。 二:课程特色 1, 一次性贯通Hadoop开发和集群管理; 2, 掌握Hadoop四大焦点:MapReduce、HDFS、HBase、Hive 3, 涵盖Hadoop集群的配置、维护、管理、监控、运维、测试、优化等主题 4, 强调动手实战 三:适合对象: 软件工程师; 数据库开发人员; 网络后台开发人员; 运维人员; 四:基础要求 了解Li Read More
posted @ 2014-02-13 21:55 王家林的Hadoop之旅 Views(310) Comments(0) Diggs(0) Edit
一:课程介绍 数据库管理人员如何管理分布式的海量数据,是云计算时代的数据库从业人员面临的核心问题之一,Hadoop提出了解决方案。 本课程从数据库管理人员与系统管理人员的职业角度出发,从动手搭建Hadoop集群环境开始,涉及Hadoop集群的配置、维护、管理、监控、运维、测试、优化等主题,并细致剖析Hive数据仓库集群和优化等主题,帮助传统的数据库管理人员和系统管理人员轻松使用Hadoop架构大规模的数据。 二:课程特色 1, 深入理解Hadoop技术架构; 2, 彻底全面清晰的理解Hadoop运作机制; 3, 能够独立规划及部署生产环境的Hadoop集群; 4, 掌握Hadoop基本运维思路和方法; 5, 对Hadoop集群进行管理和优化; 三:适合对象: 数据库管理员(DBA); 公司的系统管理员; 想转型的DBA; 四:基础要求 了解Linux系统; 了解网络; 了解 shell sql Read More
posted @ 2014-02-13 21:43 王家林的Hadoop之旅 Views(330) Comments(0) Diggs(0) Edit
一:课程简介: Hadoop是云计算分布式大数据的事实标准软件框架,Hadoop中的架构实现是整个云计算产业技术的基础,作为与Google三大核心技术DFS、MapReduce、BigTable相对的HDFS、MapReduce、和HBase也是整个Hadoop生态系统的核心的技术,本课程致力于帮您掌握这三大技术的同时掌握云计算的数据仓库挖掘技术Hive,助您在云计算技术时代自由翱翔。 二:课程特色 1, 深入浅出中动手实作; 2, 掌握Hadoop三大核心:HDFS、MapReduce、和HBase; 3, 掌握数据仓库和挖掘技术Hive; 4, 理解业界的成功典范亚马逊云计算 三:适合对象: 软件工程师; 数据库开发人员; 网络后台开发人员; 运维人员; 四:基础要求 了解Linux系统; 了解网络; 了解Java; 五:讲师简介 Hadoop源码级专家,曾负责某 Read More
posted @ 2014-02-13 21:41 王家林的Hadoop之旅 Views(492) Comments(0) Diggs(0) Edit
这一讲我们主要剖析MapReduce的原理机制和流程。 “云计算分布式大数据Hadoop实战高手之路”之完整发布目录 云计算分布式大数据实战技术Hadoop交流群:312494188,每天都会在群中发布云计算实战性资料,欢迎大家加入! 关于MapReduce,你至少需要知道以下几点: 1, MapReduce是运行于分布式文件系统之上的,在Hadoop中就是运行于HDFS之上的; 2, MapReduce主要用于大规模数据的并行运算,这种大数据通过指1TB以上; 3, MapReduce的运行原理是把一个大任务切割成很多并行运行的小任务,然后合并小任务运行完后的结果,从而得到最终结果; Read More
posted @ 2013-06-21 15:42 王家林的Hadoop之旅 Views(1135) Comments(2) Diggs(2) Edit
在前面我们安装单机版Hadoop以及Hadoop集群的时候,我们使用的只是可以工作的最小化配置项,有很多重要的配置项都还没有提及。 Read More
posted @ 2013-06-19 22:20 王家林的Hadoop之旅 Views(717) Comments(0) Diggs(2) Edit