返回顶部 Fork me on GitHub
上一页 1 ··· 3 4 5 6 7 8 9 10 11 ··· 13 下一页
摘要: 一JVM结构 1 Java内存结构 JVM内存结构主要有三大块:堆内存、方法区和栈。 堆内存是JVM中最大的一块由年轻代和老年代组成,而年轻代内存又被分成三部分,Eden空间、From Survivor空间、To Survivor空间,默认情况下年轻代按照8:1:1的比例来分配; 方法区存储类信息、 阅读全文
posted @ 2018-07-14 17:54 Frankdeng 阅读(3625) 评论(0) 推荐(0) 编辑
摘要: 一、概述 Spark 作为一个基于内存的分布式计算引擎,其内存管理模块在整个系统中扮演着非常重要的角色。理解 Spark 内存管理的基本原理,有助于更好地开发 Spark 应用程序和进行性能调优。本文旨在梳理出 Spark 内存管理的脉络,抛砖引玉,引出读者对这个话题的深入探讨。本文中阐述的原理基于 阅读全文
posted @ 2018-07-14 16:33 Frankdeng 阅读(16947) 评论(1) 推荐(5) 编辑
摘要: Spark调优主要分为开发调优、资源调优、数据倾斜调优、shuffle调优几个部分。开发调优和资源调优是所有Spark作业都需要注意和遵循的一些基本原则,是高性能Spark作业的基础;数据倾斜调优,主要讲解了一套完整的用来解决Spark作业数据倾斜的解决方案;shuffle调优,面向的是对Spark 阅读全文
posted @ 2018-07-14 15:21 Frankdeng 阅读(3329) 评论(1) 推荐(0) 编辑
摘要: 一、Spark中的基本概念 (1)Application:表示你的应用程序 (2)Driver:表示main()函数,创建SparkContext。由SparkContext负责与ClusterManager通信,进行资源的申请,任务的分配和监控等。程序执行完毕后关闭SparkContext (3) 阅读全文
posted @ 2018-07-14 14:18 Frankdeng 阅读(47846) 评论(5) 推荐(6) 编辑
摘要: 一、Hive 执行过程概述 1、概述 (1) Hive 将 HQL 转换成一组操作符(Operator),比如 GroupByOperator, JoinOperator 等 (2)操作符 Operator 是 Hive 的最小处理单元 (3)每个操作符代表一个 HDFS 操作或者 MapReduc 阅读全文
posted @ 2018-07-14 12:04 Frankdeng 阅读(5643) 评论(1) 推荐(0) 编辑
摘要: Transformation算子 基本的初始化 java scala 一、map、flatMap、mapParations、mapPartitionsWithIndex 1.1 map (1) 使用Java7进行编写 map十分容易理解,他是将源JavaRDD的一个一个元素的传入call方法,并经过 阅读全文
posted @ 2018-07-14 00:16 Frankdeng 阅读(1831) 评论(0) 推荐(1) 编辑
摘要: 一、RDD的概述 1.1 什么是RDD RDD(Resilient Distributed Dataset)叫做弹性分布式数据集,是Spark中最基本的数据抽象,它代表一个不可变、可分区、里面的元素可并行计算的集合。RDD具有数据流模型的特点:自动容错、位置感知性调度和可伸缩性。RDD允许用户在执行 阅读全文
posted @ 2018-07-13 22:37 Frankdeng 阅读(12177) 评论(1) 推荐(4) 编辑
摘要: 一 下载安装包 1 官方下载 官方下载地址:http://spark.apache.org/downloads.html 2 安装前提 Java8 安装成功 zookeeper 安装参考:CentOS7.5搭建Zookeeper3.4.12集群 hadoop 安装参考:CentOS7.5搭建Hado 阅读全文
posted @ 2018-07-12 19:52 Frankdeng 阅读(6759) 评论(0) 推荐(1) 编辑
摘要: 一、官网介绍 1 什么是Spark 官网地址:http://spark.apache.org/ Apache Spark 是专为大规模数据处理而设计的快速通用的计算引擎。Spark是UC Berkeley AMP lab (加州大学伯克利分校的AMP实验室)所开源的类Hadoop MapReduce 阅读全文
posted @ 2018-07-08 22:34 Frankdeng 阅读(3113) 评论(0) 推荐(2) 编辑
摘要: 一.下载安装 1.1Python下载 Python官网:https://www.python.org/ 1.2Python安装 1.2.1 Linux 平台安装 以下为在Unix & Linux 平台上安装 Python 的简单步骤: 打开WEB浏览器访问https://www.python.org 阅读全文
posted @ 2018-07-05 23:56 Frankdeng 阅读(8877) 评论(0) 推荐(0) 编辑
上一页 1 ··· 3 4 5 6 7 8 9 10 11 ··· 13 下一页