08 2017 档案

idea导入svn项目
摘要:查看svn的资源库: 下面的多出了一个svn的窗口,在左边有加号可以添加一个svn的库 输入svn的地址,我用的是本地的测试,所以地址为svn://127.0.0.1/newproject 根据服务不同这个地址也不一样 可能是http或着https 添加上svn库的地址后,我们可以浏览库上的文件,当 阅读全文

posted @ 2017-08-20 12:00 厚积!! 阅读(9690) 评论(0) 推荐(0)

Intellij IDEA常用配置详解
摘要:Intellij IDEA常用配置详解 1. IDEA内存优化 先看看你机器本身的配置而配置. \IntelliJ IDEA 8\bin\idea.exe.vmoptions -Xms64m -Xmx256m -XX:MaxPermSize=92m -ea -server -Dsun.awt.kee 阅读全文

posted @ 2017-08-17 17:30 厚积!! 阅读(382) 评论(0) 推荐(0)

HBase 写优化之 BulkLoad 实现数据快速入库
摘要:在第一次建立Hbase表的时候,我们可能需要往里面一次性导入大量的初始化数据。我们很自然地想到将数据一条条插入到Hbase中,或者通过MR方式等。但是这些方式不是慢就是在导入的过程的占用Region资源导致效率低下,所以很不适合一次性导入大量数据。本文将针对这个问题介绍如何通过Hbase的BulkL 阅读全文

posted @ 2017-08-17 17:28 厚积!! 阅读(2347) 评论(0) 推荐(0)

Spark性能优化之道——解决Spark数据倾斜(Data Skew)的N种姿势
摘要:原创文章,转载请务必将下面这段话置于文章开头处。本文转发自技术世界,原文链接 http://www.jasongj.com/spark/skew/ 摘要 本文结合实例详细阐明了Spark数据倾斜的几种场景以及对应的解决方案,包括避免数据源倾斜,调整并行度,使用自定义Partitioner,使用Map 阅读全文

posted @ 2017-08-15 10:57 厚积!! 阅读(537) 评论(0) 推荐(0)

avro序列化详细操作
摘要:Intellij 15.0.3 Maven avro 1.8.0 Avro是一个数据序列化系统。 它提供以下: 1 丰富的数据结构类型 2 快速可压缩的二进制数据形式 3 存储持久数据的文件容器 4 远程过程调用RPC 5 简单的动态语言结合功能,Avro和动态语言结合后,读写数据文件和使用RPC协 阅读全文

posted @ 2017-08-11 15:03 厚积!! 阅读(9961) 评论(0) 推荐(0)

导航