大数据从业者FelixZh

2018年12月26日

Starting sshd: /var/empty/sshd must be owned by root and not group or world-writable.

摘要： Starting sshd: /var/empty/sshd must be owned by root and not group or world-writable. [FAILED] 这个是权限的问题可采取以下两步解决就可以解决上述的问题阅读全文

posted @ 2018-12-26 16:50 大数据从业者FelixZh 阅读(969) 评论(0) 推荐(0) 编辑

2018年12月21日

Spark RDD持久化、广播变量和累加器

摘要： Spark RDD持久化 RDD持久化工作原理 Spark非常重要的一个功能特性就是可以将RDD持久化在内存中。当对RDD执行持久化操作时，每个节点都会将自己操作的RDD的partition持久化到内存中，并且在之后对该RDD的反复使用中，直接使用内存缓存的partition。这样的话，对于针对一个阅读全文

posted @ 2018-12-21 19:19 大数据从业者FelixZh 阅读(764) 评论(0) 推荐(0) 编辑

PSQLException: FATAL: no pg_hba.conf entry for host "127.0.0.1", user "ambari", database "ambari", SSL off

摘要： On your Postgres server, you will need to update your pg_hba.conf file to allow access for the ambari user on the ambari database coming from 127.0.0. 阅读全文

posted @ 2018-12-21 09:17 大数据从业者FelixZh 阅读(3319) 评论(0) 推荐(0) 编辑

2018年12月20日

PostgreSQL：Java使用CopyManager实现客户端文件COPY导入

摘要：在MySQL中，可以使用LOAD DATA INFILE和LOAD DATA LOCAL INFILE两种方式导入文本文件中的数据到数据库表中，速度非常快。其中LOAD DATA INFILE使用的文件要位于MySQL所在服务器上，LOAD DATA LOCAL INFILE则使用的是客户端的文件。阅读全文

posted @ 2018-12-20 16:20 大数据从业者FelixZh 阅读(3525) 评论(0) 推荐(0) 编辑

2018年12月14日

ThreadLocal的使用及原理分析

摘要：文章简介 ThreadLocal应该都比较熟悉，这篇文章会基于ThreadLocal的应用以及实现原理做一个全面的分析内容导航什么是ThreadLocal ThreadLocal的使用分析ThreadLocal的实现原理 ThreadLocal的应用场景及问题什么是ThreadLocal T 阅读全文

posted @ 2018-12-14 08:42 大数据从业者FelixZh 阅读(576) 评论(0) 推荐(0) 编辑

2018年12月1日

gradlew和gradle的区别

摘要：概念理解 gradlew就是对gradle的包装和配置，gradlew是gradle Wrapper，Wrapper的意思就是包装。因为不是每个人的电脑中都安装了gradle，也不一定安装的版本是要编译项目需要的版本，那么gradlew里面就配置要需要的gradle版本。然后用户只需要运行gra 阅读全文

posted @ 2018-12-01 17:09 大数据从业者FelixZh 阅读(4870) 评论(0) 推荐(1) 编辑

Managing Large State in Apache Flink®: An Intro to Incremental Checkpointing

摘要： January 23, 2018 - Apache Flink, Flink Features Stefan Richter and Chris Ward Apache Flink was purpose-built for stateful stream processing. Let’s qui 阅读全文

posted @ 2018-12-01 15:01 大数据从业者FelixZh 阅读(355) 评论(0) 推荐(0) 编辑

2018年11月30日

How To Size Your Apache Flink® Cluster: A Back-of-the-Envelope Calculation

摘要： January 11, 2018 - Apache Flink Robert Metzger and Chris Ward A favorite session from Flink Forward Berlin 2017 was Robert Metzger’s “Keep It Going: H 阅读全文

posted @ 2018-11-30 18:02 大数据从业者FelixZh 阅读(387) 评论(0) 推荐(0) 编辑

2018年11月27日

apache kafka & CDH kafka源码编译

摘要： Apache kafka编译前言 github网站kafka项目的README.md有关于kafka源码编译的说明 github地址：https://github.com/apache/kafka 编译环境准备 java maven gradle 编译失败原因：gradle版本太高，降低到4.8 阅读全文

posted @ 2018-11-27 14:21 大数据从业者FelixZh 阅读(991) 评论(0) 推荐(0) 编辑

2018年11月22日

Kafka集成Kerberos之后如何使用生产者消费者命令

摘要： 1、生产者1.1、准备jaas.conf并添加到环境变量（使用以下方式的其中一种）1.1.1、使用Kinit方式前提是手动kinit 配置内容为： 1.1.2、使用指定keytab和票据的方式准备好你的keytab文件配置内容为： * 添加到环境变量: 2、执行命令或者使用配置文件的方式 pr 阅读全文

posted @ 2018-11-22 10:34 大数据从业者FelixZh 阅读(3160) 评论(0) 推荐(0) 编辑

2018年11月10日

Extending the Yahoo! Streaming Benchmark

摘要： could accomplish with Flink back at Twitter. I had an application in mind that I knew I could make more efficient by a huge factor if I could use the 阅读全文

posted @ 2018-11-10 15:59 大数据从业者FelixZh 阅读(772) 评论(0) 推荐(0) 编辑

2018年10月31日

java.io.IOException: There appears to be a gap in the edit log. We expected txid ***, but got txid

摘要：方式1 原因：namenode元数据被破坏，需要修复解决：恢复一下namenode 一路选择Y，一般就OK了方式2 Need to copy the edits file to the journal node (I have 3 journal node s101 s102 s103) http 阅读全文

posted @ 2018-10-31 09:11 大数据从业者FelixZh 阅读(4061) 评论(0) 推荐(0) 编辑

2018年10月29日

大数据平台Lambda架构详解

摘要： Lambda架构由Storm的作者Nathan Marz提出。旨在设计出一个能满足。实时大数据系统关键特性的架构，具有高容错、低延时和可扩展等特。 Lambda架构整合离线计算和实时计算，融合不可变（Immutability，读写分离和隔离一系列构原则，可集成Hadoop，Kafka，Storm，阅读全文

posted @ 2018-10-29 09:30 大数据从业者FelixZh 阅读(6846) 评论(0) 推荐(0) 编辑

2018年10月27日

公司招聘大数据开发工程师（离线计算、实时计算）

摘要：国内某大数据供应商岗位要求1、本科以上学历，计算机及相关专业毕业。2、对大数据处理有强烈兴趣，掌握至少一种主流开源技术方案，如Hadoop、Spark、Flink、Hbase，ES，kafka等，熟悉开源组件开发、系统调优、高可用等技术。3、具备1-3年以上Java开发经验，掌握Python/Sc 阅读全文

posted @ 2018-10-27 09:16 大数据从业者FelixZh 阅读(1605) 评论(0) 推荐(0) 编辑

2018年10月26日

Kerberos原理

摘要：前些日子为了搞清楚Kerberos原理，把MIT的Kerberos经典对话看了几遍，终于有了一个稍微清晰的认识，这里稍微记录下，因为Kerberos是使用传统加密技术实现的一个认证机制，所以顺便备忘下关于加密的一些知识概念。本文组织如下：关于Kerberos 认证授权加密术语单点登录 Kerb 阅读全文

posted @ 2018-10-26 10:44 大数据从业者FelixZh 阅读(12994) 评论(0) 推荐(4) 编辑

2018年10月11日

ubuntu创建idea桌面快捷方式

摘要： This method can be used to create a launcher for any application, not just IntelliJ IDEA. For any launcher in Unity what you need to create is a .desk 阅读全文

posted @ 2018-10-11 16:43 大数据从业者FelixZh 阅读(2221) 评论(0) 推荐(0) 编辑

2018年10月10日

k8s--如何使用Namespaces

摘要： Namespaces 使用示例 Viewing namespaces Creating a new namespace Deleting a namespace Subdividing your cluster using Kubernetes namespaces Viewing namespac 阅读全文

posted @ 2018-10-10 17:11 大数据从业者FelixZh 阅读(391) 评论(0) 推荐(0) 编辑

Kubernetes-基于flannel的集群网络

摘要： 1、Docker网络模式在讨论Kubernetes网络之前，让我们先来看一下Docker网络。Docker采用插件化的网络模式，默认提供bridge、host、none、overlay、maclan和Network plugins这几种网络模式，运行容器时可以通过–network参数设置具体使用那阅读全文

posted @ 2018-10-10 11:27 大数据从业者FelixZh 阅读(4718) 评论(0) 推荐(0) 编辑

kubernetes-核心资源之Ingress

摘要： 1、Ingress 在Kubernetes中，服务和Pod的IP地址仅可以在集群网络内部使用，对于集群外的应用是不可见的。为了使外部的应用能够访问集群内的服务，在Kubernetes中可以通过NodePort和LoadBalancer这两种类型的服务，或者使用Ingress。插曲 start 一、阅读全文

posted @ 2018-10-10 10:29 大数据从业者FelixZh 阅读(713) 评论(0) 推荐(0) 编辑

kunbernetes-快速入门

摘要： 1、入门概述本文以在容器云上部署一个nexus3应用为例，通过通过一步步的操作，帮助用户快速的对Kubernetes有一个快速和整体的认识。通过快速入门，可以提供如下知识内容：在集群中部署一个容器的应用对部署的应用进行弹性伸缩使用新版本的软件更新容器化应用对容器话应用进行Debug 在开始阅读全文

posted @ 2018-10-10 09:57 大数据从业者FelixZh 阅读(534) 评论(0) 推荐(0) 编辑

2018年10月9日

Docker，Docker Compose，Docker Swarm，Kubernetes之间的区别

摘要： Dcoker Docker 这个东西所扮演的角色，容易理解，它是一个容器引擎，也就是说实际上我们的容器最终是由Docker创建，运行在Docker中，其他相关的容器技术都是以Docker为基础，它是我们使用其他容器技术的核心。 Docker-Compose Docker-Compose 是用来管理你阅读全文

posted @ 2018-10-09 16:54 大数据从业者FelixZh 阅读(2993) 评论(0) 推荐(3) 编辑

2018年10月8日

Kubernetes - kubectl proxy

摘要：最近在玩flink部署在k8s上，但是k8s以前没玩过，参照前几天写的文章可部署一个简单的k8shttps://www.cnblogs.com/felixzh/p/9726244.html 在参照flink官网实施flink部署到k8s集群：下图来自flink官网，图中提到kubectl proxy 阅读全文

posted @ 2018-10-08 15:58 大数据从业者FelixZh 阅读(3900) 评论(0) 推荐(0) 编辑

2018年9月29日

centos7.3 kubernetes/k8s 1.10 离线安装 --已验证

摘要：本文介绍在centos7.3使用kubeadm快速离线安装kubernetes 1.10。采用单master，单node（可以多node），占用资源较少，方便在笔记本或学习环境快速部署，不适用于生产环境。所需文件百度盘连接链接：https://pan.baidu.com/s/1iQJpKZ9P 阅读全文

posted @ 2018-09-29 18:59 大数据从业者FelixZh 阅读(2674) 评论(1) 推荐(0) 编辑

kubernetes 集群安装etcd集群，带证书

摘要： install etcd 准备证书 https://www.kubernetes.org.cn/3096.html 在master1需要安装CFSSL工具，这将会用来建立 TLS certificates。 export CFSSL_URL="https://pkg.cfssl.org/R1.2" 阅读全文

posted @ 2018-09-29 18:49 大数据从业者FelixZh 阅读(696) 评论(0) 推荐(0) 编辑

kubernetes-整体概述和架构

摘要： 1、Kubernetes是什么 Kubernetes是一个轻便的和可扩展的开源平台，用于管理容器化应用和服务。通过Kubernetes能够进行应用的自动化部署和扩缩容。在Kubernetes中，会将组成应用的容器组合成一个逻辑单元以更易管理和发现。Kubernetes积累了作为Google生产环境运阅读全文

posted @ 2018-09-29 14:11 大数据从业者FelixZh 阅读(985) 评论(0) 推荐(0) 编辑

2018年9月27日

Spark1.6之后为何使用Netty通信框架替代Akka

摘要：解决方案：一直以来，基于Akka实现的RPC通信框架是Spark引以为豪的主要特性，也是与Hadoop等分布式计算框架对比过程中一大亮点。但是时代和技术都在演化，从Spark1.3.1版本开始，为了解决大块数据（如Shuffle）的传输问题，Spark引入了Netty通信框架，到了1.6.0版本，阅读全文

posted @ 2018-09-27 19:54 大数据从业者FelixZh 阅读(2170) 评论(0) 推荐(0) 编辑

一探究竟：Namenode、SecondaryNamenode、NamenodeHA关系

摘要： NameNode与Secondary NameNode 很多人都认为，Secondary NameNode是NameNode的备份，是为了防止NameNode的单点失败的，其实并不是在这样。文章Secondary Namenode - What it really do? (需FQ)写的很通俗易懂，阅读全文

posted @ 2018-09-27 19:36 大数据从业者FelixZh 阅读(1914) 评论(0) 推荐(0) 编辑

错误ERROR datanode.DataNode (DataXceiver.java：run(278)) - hadoop07：50010DataXceiver error processing unknown operation src：127.0.0.136479 dst：127.0.0.150010

摘要：原因： Ambari 每分钟会向datanode发送"ping"连接一下去确保datanode是正常工作的.否则它会触发alert。但是datanode并没有处理空内容的逻辑,所以直接异常了解决办法：这个可以忽略，或者使用 https://issues.apache.org/jira/brows 阅读全文

posted @ 2018-09-27 10:47 大数据从业者FelixZh 阅读(769) 评论(0) 推荐(0) 编辑

并发框架Disruptor场景应用

摘要：今天用一个停车场问题来加深对Disruptor的理解。一个有关汽车进入停车场的问题。当汽车进入停车场时，系统首先会记录汽车信息。同时也会发送消息到其他系统处理相关业务，最后发送短信通知车主收费开始。看了很多文章，里面的代码都是大同小异的，可能代码真的是很经典。以下代码也是来源网络，只是自己手动敲的，阅读全文

posted @ 2018-09-27 09:23 大数据从业者FelixZh 阅读(2415) 评论(0) 推荐(0) 编辑

构建高性能服务 Java高性能缓冲设计 vs Disruptor vs LinkedBlockingQueue

摘要：一个仅仅部署在4台服务器上的服务，每秒向Database写入数据超过100万行数据，每分钟产生超过1G的数据。而每台服务器（8核12G）上CPU占用不到100%，load不超过5。这是怎么做到呢？下面将给你描述这个架构，它的核心是一个高效缓冲区设计，我们对它的要求是： 1，该缓存区要尽量简单 2，尽阅读全文

posted @ 2018-09-27 09:20 大数据从业者FelixZh 阅读(1208) 评论(0) 推荐(0) 编辑

大数据从业者

最新文章，见微信公众号：大数据从业者

公告