JacobZheng

[置顶] Hadoop相关问题解决

posted @ 2019-12-18 16:10 JacobZheng 阅读(7630) 评论(0) 推荐(1)

2020年8月10日

深入理解JVM（三）ClassLoader与类加载

摘要：类基础java特性：跨平台，一次编译，到处运行一个JAVA类从编写到使用，会经过以下流程graph LRfile[.java文件]--编译-->cla[.class文件]cla--不同平台JVM解析-->command[机器指令]先编译成字节码，再由不同平台JVM解析，运行时不需要重编译。java虚拟机在执行字节码时，转换成机器指令。为什么不解析成机器码？不用每次执行需要检查保持兼容性例如s... 阅读全文

posted @ 2020-08-10 12:07 JacobZheng 阅读(413) 评论(0) 推荐(0)

2020年7月22日

Spark入门（第1讲）

摘要：一、Spark是什么引用官方文档的一句话Apache Spark™ is a unified analytics engine for large-scale data processing.Apache Spark™是用于大规模数据处理的统一分析引擎。可以从这句话拆分出几个关键点统一大数据分析引擎/计算引擎何为统一Spark的主要目标是为编写大数据应用程序提供统一的平台，其中包括统一计算引擎和统... 阅读全文

posted @ 2020-07-22 10:27 JacobZheng 阅读(370) 评论(0) 推荐(0)

2020年7月8日

深入理解JVM（二）垃圾收集器

摘要： GC三问：哪些内存需要回收？什么时候回收？如何回收？程序计数器、虚拟机栈、本地方法栈随线程而生，随线程而灭，栈帧的内存分配在类结构确定下来就已知，在方法结束或者线程结束时就会回收。所以垃圾回收关注的是动态的堆内存。ps. 方法区也能被回收，主要回收废弃常量和无用类，但性价比高，不过多描述。1.哪些内存需要回收这个问题的关键就是确定哪些内存是存活着，哪些内存死去（不再会被用到的）引用计数算法有引用时... 阅读全文

posted @ 2020-07-08 14:59 JacobZheng 阅读(232) 评论(0) 推荐(0)

数据治理工具调研之DataHub

摘要： 1.项目简介Apache Atlas是Hadoop社区为解决Hadoop生态系统的元数据治理问题而产生的开源项目，它为Hadoop集群提供了包括数据分类、集中策略引擎、数据血缘、安全和生命周期管理在内的元数据治理核心能力。官网地址：http://atlas.apache.org/2.项目架构Data Hub使用的是Generalized metadata architecture(GMA)，重点面... 阅读全文

posted @ 2020-07-08 14:55 JacobZheng 阅读(6061) 评论(0) 推荐(0)

数据治理

摘要： 1.为什么要数据治理Ebay--Why do we do data governanceTo ensure security and privacy of the data and access control.确保数据和访问控制的安全性和私密性。To capture the metadata of datasets for security and end-user data consumpti... 阅读全文

posted @ 2020-07-08 14:52 JacobZheng 阅读(555) 评论(1) 推荐(0)

2020年6月12日

深入理解JVM（一）Java内存区域

摘要：运行时数据区程序计数器当前线程执行的字节码的行号指示器每条线程都有独立的程序计数器，各线程之间计数器互不影响，独立存储。如果执行的是java方法，计数器记录正在执行的虚拟机字节码指令的位置；如果执行的是native方法，计数器值为空（undefined）虚拟机栈每个方法在执行的同时会创阅读全文

posted @ 2020-06-12 15:31 JacobZheng 阅读(195) 评论(0) 推荐(0)

2020年3月30日

死磕Spring源码之AliasRegistry

摘要：死磕Spring源码之AliasRegistry 父子关系代码实现作为bean定义的最顶层接口，这个接口定义了管理别名的一些方法，主要作用是将名字别名映射存到内存中。提供查找和校验的接口。阅读全文

posted @ 2020-03-30 17:38 JacobZheng 阅读(274) 评论(0) 推荐(0)

2020年3月6日

如何获取json某一级节点的数据

摘要：如何获取json某一级节点的数据最近做项目有获取和设置固定格式某一级节点值的需求。但是要一级一级地取对于多级的结构来说代码过于冗余且重复，于是写了个递归的方法根据json路径完成值的定点操作。废话不多说直接贴代码。 / 通用的通过json路径找到json值 @param jsonObject 要阅读全文

posted @ 2020-03-06 23:57 JacobZheng 阅读(4143) 评论(0) 推荐(0)

2020年2月21日

Unable to find a constructor that takes a String param or a valueOf() or fromString() method

摘要： Unable to find a constructor that takes a String param or a valueOf() or fromString() method 最近在做服务的dubbo rest改造，在启动服务的时候遇到这个错。大意就是我的@QueryParam注解下的参阅读全文

posted @ 2020-02-21 15:04 JacobZheng 阅读(1630) 评论(0) 推荐(0)

2020年1月9日

java并发编程[持续更新]

摘要： [toc] java并发编程 1.常用类介绍 Semaphore Semaphore 类是一个计数信号量，必须由获取它的线程释放，通常用于限制可以访问某些资源（物理或逻辑的）线程数目。 Semaphore包含三种操作 1. 初始化 2. 获取acquire() 3. 释放 release() 当信阅读全文

posted @ 2020-01-09 16:59 JacobZheng 阅读(201) 评论(0) 推荐(0)

公告