随笔档案「2017年8月」 - 厚积！！

idea导入svn项目

摘要：查看svn的资源库：下面的多出了一个svn的窗口，在左边有加号可以添加一个svn的库输入svn的地址，我用的是本地的测试，所以地址为svn://127.0.0.1/newproject 根据服务不同这个地址也不一样可能是http或着https 添加上svn库的地址后，我们可以浏览库上的文件，当阅读全文

posted @ 2017-08-20 12:00 厚积！！阅读(9690) 评论(0) 推荐(0)

Intellij IDEA常用配置详解

摘要：Intellij IDEA常用配置详解 1. IDEA内存优化先看看你机器本身的配置而配置. \IntelliJ IDEA 8\bin\idea.exe.vmoptions -Xms64m -Xmx256m -XX:MaxPermSize=92m -ea -server -Dsun.awt.kee 阅读全文

posted @ 2017-08-17 17:30 厚积！！阅读(382) 评论(0) 推荐(0)

HBase 写优化之 BulkLoad 实现数据快速入库

摘要：在第一次建立Hbase表的时候，我们可能需要往里面一次性导入大量的初始化数据。我们很自然地想到将数据一条条插入到Hbase中，或者通过MR方式等。但是这些方式不是慢就是在导入的过程的占用Region资源导致效率低下，所以很不适合一次性导入大量数据。本文将针对这个问题介绍如何通过Hbase的BulkL 阅读全文

posted @ 2017-08-17 17:28 厚积！！阅读(2347) 评论(0) 推荐(0)

Spark性能优化之道——解决Spark数据倾斜（Data Skew）的N种姿势

摘要：原创文章，转载请务必将下面这段话置于文章开头处。本文转发自技术世界，原文链接　http://www.jasongj.com/spark/skew/ 摘要本文结合实例详细阐明了Spark数据倾斜的几种场景以及对应的解决方案，包括避免数据源倾斜，调整并行度，使用自定义Partitioner，使用Map 阅读全文

posted @ 2017-08-15 10:57 厚积！！阅读(537) 评论(0) 推荐(0)

avro序列化详细操作

摘要：Intellij 15.0.3 Maven avro 1.8.0 Avro是一个数据序列化系统。它提供以下： 1 丰富的数据结构类型 2 快速可压缩的二进制数据形式 3 存储持久数据的文件容器 4 远程过程调用RPC 5 简单的动态语言结合功能，Avro和动态语言结合后，读写数据文件和使用RPC协阅读全文

posted @ 2017-08-11 15:03 厚积！！阅读(9961) 评论(0) 推荐(0)

08 2017 档案

idea导入svn项目

Intellij IDEA常用配置详解

HBase 写优化之 BulkLoad 实现数据快速入库

Spark性能优化之道——解决Spark数据倾斜（Data Skew）的N种姿势

avro序列化详细操作

导航

公告