半夜ATM机前看书的那位

导航

2011年8月17日 #

动态规划和求解最长公共子序列介绍

摘要: 动态规划是一种在数学和计算机科学中使用的,用于求解包含重叠子问题的最优化问题的方法。其基本思想是,将原问题分解为相似的子问题,在求解的过程中通过子问题的解求出原问题的解。动态规划的思想是多种算法的基础,被广泛应用于计算机科学和工程领域。比较著名的应用实例有:求解最短路径问题,背包问题,项目管理,网络流优化等。概述动态规划在查找有很多重叠子问题的情况的最优解时有效。它将问题重新组合成子问题。为了避免多次解决这些子问题,它们的结果都逐渐被计算并被保存,从简单的问题直到整个问题都被解决。因此,动态规划保存递归时的结果,因而不会在解决同样的问题时花费时间。动态规划只能应用于有最优子结构的问题。最优子结 阅读全文

posted @ 2011-08-17 21:10 zhizhesky 阅读(556) 评论(0) 推荐(0) 编辑

2011年8月16日 #

google plus

该文被密码保护。 阅读全文

posted @ 2011-08-16 18:15 zhizhesky 阅读(2) 评论(0) 推荐(0) 编辑

Design, Scale and Performance of MapR's Distribution for Hadoop

摘要: MapR is a complete distribution that is 100%API compatiblewith ApacheHadoop(MapReduce, HDFS and HBase). Design, Scale and Performance of MapR's Distribution for Hadoop View more presentations from mcsrivas 阅读全文

posted @ 2011-08-16 17:40 zhizhesky 阅读(247) 评论(0) 推荐(0) 编辑

hadoop作业调优参数整理及原理(转自淘宝数据 tbdata.org)

摘要: 1 Map side tuning参数1.1 MapTask运行内部原理当map task开始运算,并产生中间数据时,其产生的中间结果并非直接就简单的写入磁盘。这中间的过程比较复杂,并且利用到了内存buffer来进行已经产生的部分结果的缓存,并在内存buffer中进行一些预排序来优化整个map的性能。如上图所示,每一个map都会对应存在一个内存buffer(MapOutputBuffer,即上图的buffer in memory),map会将已经产生的部分结果先写入到该buffer中,这个buffer默认是100MB大小,但是这个大小是可以根据job提交时的参数设定来调整的,该参数即为:io. 阅读全文

posted @ 2011-08-16 17:28 zhizhesky 阅读(208) 评论(0) 推荐(0) 编辑

2011年8月15日 #

Linux2.6内核epoll介绍

摘要: [作者]:滕昱,2005/3/30,0.1版本[版权声明]:此文档遵循GNU自由文档许可证(GNU Free Documentation License).任何人可以自由复制,分发,修改,不过如果方便,请注明出处和作者:)(1)导言:首先,我强烈建议大家阅读Richard Stevens著作《TCP/IP Illustracted Volume 1,2,3》和《UNIX Network Programming Volume 1,2》。虽然他离开我们大家已经5年多了,但是他的书依然是进入网络编程的最直接的道路。其中的3卷的《TCP/IP Illustracted》卷1是必读-如果你不了解tcp协 阅读全文

posted @ 2011-08-15 12:39 zhizhesky 阅读(276) 评论(0) 推荐(0) 编辑

数据结构 java 整理

摘要: 都是取之于JDK源码或者 apache、 google jar 包源码 /** * Reverses the order of the elements in the specified list.<p> * * This method runs in linear time. * * @param list the list whose elements are to be reversed. * @throws UnsupportedOperationException if the specified list or * its list-iterator does not 阅读全文

posted @ 2011-08-15 12:37 zhizhesky 阅读(264) 评论(0) 推荐(0) 编辑

linux中screen命令的用法

摘要: 原文 http://www.9usb.net/201002/linux-screen-mingling.htmlScreen被称之为一个全屏窗口管理器,用他可以轻松在一个物理终端上获得多个虚拟终端的效果。Screen功能说明:简单来说,Screen是一个可以在多个进程之间多路复用一个物理终端的窗口管理器,这意味着你能够使用一个单一的终端窗口运行多终端的应用。Screen中有会话的概念,用户可以在一个screen会话中创建多个screen窗口,在每一个screen窗口中就像操作一个真实的telnet/SSH连接窗口那样。Screen命令语法:screen [-AmRvx -ls -wipe][- 阅读全文

posted @ 2011-08-15 10:37 zhizhesky 阅读(345) 评论(0) 推荐(0) 编辑

从哈希存储到Bloom Filter

摘要: 先解释一下什么是哈希函数。哈希函数简单来说就是一种映射,它可取值的范围(定义域)通常很大,但值域相对较小。哈希函数所作的工作就是将一个很大定义域内的值映射到一个相对较小的值域内。传统的哈希存储假设要哈希的集合为S,它有n个元素。传统的哈希方法是,将哈希区域组织成h(h > n)个格子的列表,每一个格子都能存储S中的一个元素。存储时将S中的每一个元素映射到{0, 1, … , h-1}的范围内,然后以这个值为索引将此元素存储到对应的格子内。由于哈希函数将一个大集合映射到一个小集合中,所以存在将大集合中的多个元素映射到同一位置的情况,这就是所谓的碰撞(Collision)。当碰撞发生时,有多 阅读全文

posted @ 2011-08-15 10:19 zhizhesky 阅读(350) 评论(0) 推荐(0) 编辑

2011年8月12日 #

搬家

摘要: 准备从其他空间搬到这里~~~ 阅读全文

posted @ 2011-08-12 00:34 zhizhesky 阅读(104) 评论(0) 推荐(0) 编辑

MySQL锁机制/管理(并发锁,行锁,表锁,预加锁,全局锁等等)-转

摘要: 百度博客居然无缘无故被封了。。。。。搬家中。。。转自MySQL实验室1.MySQL中并发和隔离控制机制Meta-data元数据锁:在table cache缓存里实现的,为DDL(Data Definition Language)提供隔离操作。一种特别的meta-data元数据类型,叫Name Lock。(SQL层)表级table-level数据锁(SQL层)存储引擎特有机制 — row locks行锁,page locks页锁,table locks表级,版本控制(在引擎中实现)全局读锁 — FLUSH TABLES WITH READ LOCK(SQL层)2.在语句执行中表的生命周期DML( 阅读全文

posted @ 2011-08-12 00:28 zhizhesky 阅读(1320) 评论(0) 推荐(0) 编辑