lihui1625 - 博客园

2014年12月29日

MapReduce Design Patterns（3.过滤器、布隆过滤器）（五）

摘要： http://blog.csdn.net/cuirong1986/article/details/8465630 Chapter 3. Filtering Patterns 本章的模式有一个共同点：不会改变原来的记录。这种模式是找到一个数据的子集，或者更小，例如取前十条,或者很大，例如结果去重。这种阅读全文

posted @ 2014-12-29 16:34 lihui1625 阅读(230) 评论(0) 推荐(0)

MapReduce Design Patterns（3.过滤器、布隆过滤器）（五）

posted @ 2014-12-29 16:34 lihui1625 阅读(607) 评论(0) 推荐(0)

MapReduce Design Patterns（3. 反向索引、计数器）（四）

摘要： http://blog.csdn.net/cuirong1986/article/details/8456923 Inverted Index Summarizations Pattern Description 反向索引模式在MapReduce分析中经常作为一个例子。我们将会讨论我们要创建的ter 阅读全文

posted @ 2014-12-29 16:19 lihui1625 阅读(141) 评论(0) 推荐(0)

MapReduce Design Patterns（3. 反向索引、计数器）（四）

posted @ 2014-12-29 16:19 lihui1625 阅读(130) 评论(0) 推荐(0)

MapReduce Design Patterns（2. 中位数、方差）（三）

摘要： http://blog.csdn.net/cuirong1986/article/details/8455335 Median and standard deviation 中值和标准差的计算比前面的例子复杂一点。因为这种运算是非关联的，它们不是那么容易的能从combiner中获益。中值是将数据集一阅读全文

posted @ 2014-12-29 16:10 lihui1625 阅读(171) 评论(0) 推荐(0)

MapReduce Design Patterns（2. 中位数、方差）（三）

posted @ 2014-12-29 16:10 lihui1625 阅读(412) 评论(0) 推荐(0)

MapReduce Design Patterns（2. 最大值、最小值、总数、个数、均值）（二）

摘要： http://blog.csdn.net/cuirong1986/article/details/8451336 CHAPTER 2 .Summarization Patterns 随着每天都有更多的数据加载进系统，数据量变得很庞大。这一章专注于对你的数据顶层的，概括性意见的设计模式，从而使你能扩展阅读全文

posted @ 2014-12-29 16:00 lihui1625 阅读(358) 评论(0) 推荐(0)

MapReduce Design Patterns（2. 最大值、最小值、总数、个数、均值）（二）

posted @ 2014-12-29 16:00 lihui1625 阅读(165) 评论(0) 推荐(0)

MapReduce Design Patterns（chapter 1）（一）简介

摘要： http://blog.csdn.net/cuirong1986/article/details/8443841 Chapter 1. Design Patterns and MapReduce MapReduce 是一种运行于成百上千台机器上的处理数据的框架，目前被google，Hadoop等多家阅读全文

posted @ 2014-12-29 15:46 lihui1625 阅读(136) 评论(0) 推荐(0)

MapReduce Design Patterns（chapter 1）（一）简介

posted @ 2014-12-29 15:46 lihui1625 阅读(139) 评论(0) 推荐(0)

Hadoop中两表JOIN的处理方法

摘要： http://dongxicheng.org/mapreduce/hadoop-join-two-tables/ 1. 概述在传统数据库（如：MYSQL）中，JOIN操作是非常常见且非常耗时的。而在HADOOP中进行JOIN操作，同样常见且耗时，由于Hadoop的独特设计思想，当进行JOIN操作时阅读全文

posted @ 2014-12-29 14:26 lihui1625 阅读(717) 评论(0) 推荐(0)

MapReduce数据处理两表join连接 (Ruduce端连接)

摘要： http://blog.csdn.net/qq272936993/article/details/7457553 现在这里有两个text文档,需要把它合并成一个文档,并且里面的数据不能有冗余.. user.txt文件: depart.txt文件：生成文件：因为user.txt文档的第3个字段与d 阅读全文

posted @ 2014-12-29 14:10 lihui1625 阅读(193) 评论(0) 推荐(0)

2014年12月28日

笔记：Java 性能优化权威指南第4章 JVM性能监控

摘要： JVM 性能监控一般在生产环境中。一、垃圾收集 JVM 记录垃圾收集报告几乎没有什么额外开销，因此建议在生产环境中开启: -verbose:gc -XX:+PrintGCDetails -XX:+PrintGCTimeStamps -Xloggc:/opt/hbase/bin/../logs/gc 阅读全文

posted @ 2014-12-28 17:12 lihui1625 阅读(141) 评论(0) 推荐(0)

笔记：Java 性能优化权威指南第3章 JVM概览

摘要：一、JVM 的基本架构 JIT编译器 (Just-In-Time Compiler, 即时编译器)：Client 或 Server 垃圾收集器：Serial、Parallel、CMS、G1 JVM Runtime： 32 位JVM 的最大内存约为2.5~3G . 64 位JVM 的指针压缩：-XX: 阅读全文

posted @ 2014-12-28 16:32 lihui1625 阅读(141) 评论(0) 推荐(0)

笔记：Java 性能优化权威指南第2章操作系统性能监控

摘要：一、CPU 使用率命令： vmstat 输出最后的CPU列:：us = user， sy=system ，id=idle ，wa=waiting ，st= 命令： mpstat 输出命令： top 输出二、CPU调度程序运行队列命令： vmstat 三、内存利用率命令： vmstat m 阅读全文

posted @ 2014-12-28 13:43 lihui1625 阅读(163) 评论(0) 推荐(0)

启用 jstatd 供远程VisualVM 连接

摘要： jstatd 的启动步骤： 1、新建文件jstatd.all.policy，内容如下 2、启动 3、启动 jvisualvm 4、连接 5、成功阅读全文

posted @ 2014-12-28 11:58 lihui1625 阅读(205) 评论(0) 推荐(0)

2014年12月26日

笔记 JVM调优流程

摘要：待续阅读全文

posted @ 2014-12-26 09:39 lihui1625 阅读(104) 评论(0) 推荐(0)

笔记：HBase 协处理器总结

摘要：一、协处理器的种类 1、observer：与触发器相似，回调函数在一些特定事件发生时候被执行。主要接口有RegionObserver、MasterObserver、WALObserver 2、endpoint：与存储过程类似，通过一些远程过程调用来动态扩展RPC协议。二、 Coprocessor 阅读全文

posted @ 2014-12-26 09:38 lihui1625 阅读(255) 评论(0) 推荐(0)

2014年12月24日

笔记：Java程序性能优化

摘要：一、设计模式 1、单例模式：对于频繁使用的对象，可以省略创建对象所花费的时间，减少内存使用频率，减轻GC压力。单例模式相比静态类的优势：可以继承、被继承、实现接口，面向对象风格；静态类不行，是面向过程风格的。 2、代理模式：因为安全原因，屏蔽客户端直接访问真实对象；远程调用，隐藏远程调用的细节阅读全文

posted @ 2014-12-24 14:38 lihui1625 阅读(149) 评论(0) 推荐(0)

使用apache+ glassfish实现负载均衡和集群

摘要： http://thoughtfly.iteye.com/blog/1426996 glassfish已经内部实现集群步骤启动某个域后，打开后台管理 1.创建一个节点 2.创建一个集群并指向特定节点 3.在集群下创建实例，实例分两种，本机的和远程的。远程的要使用SSH安全套接字。确认后会给出新的监听阅读全文

posted @ 2014-12-24 13:18 lihui1625 阅读(222) 评论(0) 推荐(0)

2014年12月23日

通向架构师的道路（第五天）之tomcat集群-群猫乱舞

摘要： http://blog.csdn.net/lifetragedy/article/details/7712691 一、为何要集群单台App Server再强劲，也有其瓶劲，先来看一下下面这个真实的场景。当时这个工程是这样的，tomcat这一段被称为web zone，里面用spring+ws，还装阅读全文

posted @ 2014-12-23 17:34 lihui1625 阅读(162) 评论(0) 推荐(0)

通向架构师的道路（第四天）之Tomcat性能调优-让小猫飞奔

摘要： http://blog.csdn.net/lifetragedy/article/details/7708724 一、总结前一天的学习从“第三天”的性能测试一节中，我们得知了决定性能测试的几个重要指标，它们是： ü 吞吐量 ü Responsetime ü Cpuload ü MemoryUsag 阅读全文

posted @ 2014-12-23 17:32 lihui1625 阅读(149) 评论(0) 推荐(0)

通向架构师的道路（第三天）之apache性能调优

摘要：一、总结前一天的学习在前两天的学习中我们知道、了解并掌握了Web Server结合App Server实现单向Https的这样的一个架构。这个架构是一个非常基础的J2ee工程上线布署时的一种架构。在前两天的教程中，还讲述了Http服务器、App Server的最基本安全配置（包括单向https的实阅读全文

posted @ 2014-12-23 17:27 lihui1625 阅读(258) 评论(0) 推荐(0)

通向架构师的道路（第一天）之Apache整合Tomcat

摘要：一、先从J2EE工程的通用架构说起这是一个通用的Web即B/S工程的架构，它由： ü Web Server ü App Server ü DB Server 三大部分组成，其中： ² Web Server 置于企业防火墙外，这个防火墙，大家可以认为是一个CISCO路由器，然后在CISCO路由器上开阅读全文

posted @ 2014-12-23 16:29 lihui1625 阅读(163) 评论(0) 推荐(0)

笔记：Class 的生命周期

摘要：一、Class的生命周期 1、加载：将.class 文件读取到内存，存放在方法区(Perm Gen), 最终产品是Class对象。 2、验证：检查是否有正确数据结构。 3、准备：JVM为Class的静态变量分配内存，并设置默认初始值。 4、解析：把Class的二进制数据中的符号引用替换为直接引用。阅读全文

posted @ 2014-12-23 15:36 lihui1625 阅读(195) 评论(0) 推荐(0)

2014年12月21日

笔记：深入理解JVM 第5章调优案例分析与实战

摘要： 1、每天15万 PV 的在线文档类型网站环境：4 CPU，16GB 内存， 64位 CentOS 5.4 问题：网站失去响应原先JVM配置：JDK1.5， -Xmx12G -Xms12G 解决过程：发现问题来自GC停顿（12G内存的 Full GC 需要12秒），内存中暂存文件导致“朝生夕灭” 阅读全文

posted @ 2014-12-21 21:47 lihui1625 阅读(154) 评论(0) 推荐(0)

笔记：深入理解JVM 第4章 JVM性能监控与故障处理工具

摘要： 1、jps 列出JVM 进程其中： -m 列出输入参数；-l 列出类全名；-v 列出JVM 参数命令： jps -l 输出：命令：jps -l -m -v 2、jstat 列出JVM统计信息命令： jstat -gc 7164 250 20 （获取进程7164的Heap 状况，250毫秒为阅读全文

posted @ 2014-12-21 21:40 lihui1625 阅读(337) 评论(0) 推荐(0)

笔记：深入理解JVM 第3章垃圾回收器与内存分配策略

摘要： 1、对象是否已死 (1). 引用计数法：无法回收相互引用的对象，故JVM没有采用例子：以上例子使用引用计数法无法回收，但是JVM使用的不是，JVM可回收。 (2). 可达性分析算法：通过一系列“GC root” 作为起始点，从这些节点开始往下搜索，搜索经过的路径成为引用链。若对象不与引用链相连阅读全文

posted @ 2014-12-21 21:25 lihui1625 阅读(120) 评论(0) 推荐(0)

笔记：深入理解JVM 第2章 Java内存区域与内存溢出

摘要： 1、JVM 运行时数据区所有线程共享的数据区：方法区（持久代）、堆区线程隔离的数据区：程序计数器、Java虚拟机栈区堆区构成：新生代 ( 由Eden, From Survivor, To Survivor 构成)、老生代运行时常量池：方法区一部分，用于存放编译期生成的各种字面量和符号引用直阅读全文

posted @ 2014-12-21 16:53 lihui1625 阅读(116) 评论(0) 推荐(0)

tomcat 内存配置优化 Xms Xmx

摘要： http://blog.chinaunix.net/uid-26602509-id-4110150.html 简介考虑一下这种场景，你开发了一个应用，它有十分优秀的布局设计，最新的特性以及其它的优秀特点。但是在性能这方面欠缺，不管这个应用如何都会遭到客户拒绝。客户总是期望它们的应用应该有更好的性能阅读全文

posted @ 2014-12-21 10:47 lihui1625 阅读(2139) 评论(0) 推荐(0)

公告