2019年1月25日
摘要: 一:Git是什么? Git是目前世界上最先进的分布式版本控制系统。 二:SVN与Git的最主要的区别? SVN是集中式版本控制系统,版本库是集中放在中央服务器的,而干活的时候,用的都是自己的电脑,所以首先要从中央服务器哪里得到最新的版本,然后干活,干完后,需要把自己做完的活推送到中央服务器。集中式版 阅读全文
posted @ 2019-01-25 10:16 杰我天下 阅读(236) 评论(0) 推荐(0) 编辑
  2017年9月10日
摘要: 一. 解压安装jdk 在shell终端下进入jdk-6u14-linux-i586.bin文件所在目录, 执行命令 ./jdk-6u14-linux-i586.bin 这时会出现一段协议,连继敲回车,当询问是否同意的时候,输入yes,回车。之后会在当前目录下生成一个jdk1.6.0_14目录,你可以 阅读全文
posted @ 2017-09-10 12:44 杰我天下 阅读(138) 评论(0) 推荐(0) 编辑
  2017年6月19日
摘要: 一、什么是缓存1、Cache是高速缓冲存储器 一种特殊的存储器子系统,其中复制了频繁使用的数据以利于快速访问2、凡是位于速度相差较大的两种硬件/软件之间的,用于协调两者数据传输速度差异的结构,均可称之为 Cache 二、缓存的分类1、基于web应用的系统架构图 2、在系统架构的不同层级之间,为了加快 阅读全文
posted @ 2017-06-19 10:35 杰我天下 阅读(331) 评论(0) 推荐(0) 编辑
  2017年3月20日
摘要: java多态性 多态分两种: (1) 编译时多态(设计时多态):方法重载。 (2) 运行时多态:JAVA运行时系统根据调用该方法的实例的类型来决定选择调用哪个方法则被称为运行时多态。(我们平时说得多的事运行时多态,所以多态主要也是指运行时多态) 运行时多态存在的三个必要条件: 一、要有继承(包括接口 阅读全文
posted @ 2017-03-20 20:34 杰我天下 阅读(1226) 评论(0) 推荐(0) 编辑
  2017年2月15日
摘要: 一、oracle基本常用的数据类型 varchar(长度) 字符串char(长度) 字符number(x,y) x表示总位数 y表示保留小数点后几位数 eg面试题:number(5,3)最大的数是99.999decimal() 数字long int integer 整数date 日期timestam 阅读全文
posted @ 2017-02-15 22:01 杰我天下 阅读(25611) 评论(0) 推荐(1) 编辑
  2017年2月13日
摘要: 今天被问到hive的数据倾斜,觉得自己对这块理解比较欠缺,某度了一下进行深入学习: hive在跑数据时经常会出现数据倾斜的情况,使的作业经常reduce完成在99%后一直卡住,最后的1%花了几个小时都没跑完,这种情况就很可能是数据倾斜的原因,解决方法要根据具体情况来选择具体的方案 1、join的ke 阅读全文
posted @ 2017-02-13 17:38 杰我天下 阅读(400) 评论(0) 推荐(0) 编辑
  2017年2月8日
摘要: HBase中删除一张表 先disable ‘tableName’ 再drop ‘tableName’来删除表 问:如果region非常多(但没有访问量了),对线上会有什么影响吗? 答:disable只是改了一下ZK里面table的状态。drop也不是现场就把hfile删掉了,只是迁移到.archiv 阅读全文
posted @ 2017-02-08 11:19 杰我天下 阅读(3088) 评论(0) 推荐(0) 编辑
  2017年1月4日
摘要: 本来想讲自己用到的写出来了,结果发现一个比较全面的文章已经介绍过了,那我就不在重新发明轮子了,我也跟着学习一下。 转自:http://jeffxie.blog.51cto.com/1365360/317524 DDL Operations 创建表 hive> CREATE TABLE pokes ( 阅读全文
posted @ 2017-01-04 16:08 杰我天下 阅读(164) 评论(0) 推荐(0) 编辑
  2016年12月28日
摘要: Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供完整的sql查询功能,可以将sql语句转换为MapReduce任务进行运行。其优点是学习成本低,可以通过类SQL语句快速实现简单的MapReduce统计,不必开发专门的MapReduce应用,十分适合数据仓 阅读全文
posted @ 2016-12-28 16:52 杰我天下 阅读(657) 评论(0) 推荐(0) 编辑
摘要: 本文转自hbase。收藏学习下。 随着大数据的越来越普及,HBase也变得越来越流行。会用HBase现在已经变的并不困难,然而,怎么把它用的更好却并不简单。那怎么定义‘用的好’呢?很简单,在保证系统稳定性、可用性的基础上能够用最少的系统资源(CPU,IO等)获得最好的性能(吞吐量,读写延迟)就是’用 阅读全文
posted @ 2016-12-28 11:47 杰我天下 阅读(5366) 评论(0) 推荐(0) 编辑