摘要:
虽然Memory Pool/Cache似乎是比较偏系统底层的东西,但是很多大规模分配和释放memory的程序在到了优化阶段之后,使用Memory Pool/Cache几乎是一个必备的手段。这跟互联网应用的大量连接的应用类似,这类应用往往也要使用Thread Pool,来避免不停创建/销毁线程的高昂代价。至于Memory Pool和Memory Cache的相同与不同之处,我个人是这么理解的:1相同之处:(为了达到提高效率的目的)允许有效数据和无效数据并存。而且,无论是Pool还是cache,往往都是限定大小的区域(因为在运行时改变大小,就意味着巨大的开销)。2 不同之处:对Pool来说,有效数 阅读全文
摘要:
数据结构中的经典问题之一就是根据二叉树的某种遍历序列重建二叉树,比如给出前序和中序序列,但是要求输出后序遍历的结果。这里仅仅帖一份根据前序和中序遍历重建二叉树的代码吧(要输出后序遍历的结果,只要添加一个后序遍历函数即可),正好是POJ 2255的答案。#include <iostream>#include <map>#include <utility>#include <functional>#include <string>#include <stack>using namespace std;typedef char 阅读全文
摘要:
其实这个算法写了很多次了,但是总是理解不深。这次专门拿出时间好好的分析一下。【基本原理】称为三角算法。以下面的简单图示表示。假设v1是我们的源点,它的最短路径长度已固定(为0)。那么首先找到的最短路径是v1-v2。找到v2之后,我们最短路径长度已固定的节点的集合就变成了{v1,v2}。那么需要更新与v2邻接的所有节点的最短路径长度的值,由于1+2<5,所以v3的最短路径长度就更新为3而不是保持为5。当然,如果v2到v3的距离大于4,v3的最短路径长度是不需要更新的。Dijkstra的最短路径算法往往有几种存储方式,例如:(1)邻接矩阵。形如a[i][j]来存储节点i与节点j之间的路径。( 阅读全文
摘要:
思路来自于微软的《编程之美》。注意:子序列(subsequence)和连续子数组还是不一样的,子序列可以是不连续的。/*****************************列出了四种算法,复杂度从O(N^3)到O(N)Author: MicroGrapeDate:2009-5-20*****************************/#include <iostream>using namespace std;/*O(N^3) algorithm*/int MaxSubSumA(int a[], int n){int maxsum = 0;for(int i = 0; i 阅读全文
摘要:
【原理】这个算法也是求最短路径时常用的算法,但由于其复杂度为O(EV)其中E、V分别为边的总数和顶点的总数。如果当为稠密图时,E也是O(V^2)的级别,因此整体复杂度会达到O(E^3)。如果是稀疏图,则无法达到使用优先队列的Dijkstra算法的O(E*logV)。因此,Bellman-Ford算法更适合于稠密图。但是它相比Dijkstra算法更好的一点就是,它能够处理带有负权值的边。但是依然无法处理负权值的回路,如果遇到的话会检测到,从而退出程序。算法思想如下:Bellman-Ford算法能在更普遍的情况下(存在负权边)解决单源点最短路径问题。对于给定的带权(有向或无向)图 G=(V,E), 阅读全文
摘要:
字符串匹配是算法中的一个重要领域,常用在计算机科学的自然语言处理和模式匹配中。(一)经典的字符串匹配算法(1)穷举或者暴力法/brute force简称BF。(2)大名鼎鼎的KMP算法(Knuth-Morris-Pratt)。(3)Horspool算法及Boyer-Moore算法。(4)其他:如Sunday算法,BOM算法(Backward Oracle Matching),BNDM算法(Backward Nondeterministic Dawg Matching)等等。这些我根本就没有看过,本文中就不再讨论了。(二)字符串匹配算法的联系和区别我们要进行字符串匹配,肯定是一个字符一个字符的比 阅读全文
摘要:
这里只贴一份来自《算法导论》的伪代码改写的代码。void KMP_prefix( const char *t, int *next ){int len = strlen(t) ;int i, j = -1 ; next[0] = -1 ;//请读者自行思考i什么时候增长for( i=1; i<len; ++i ) {//i永远和j+1位的比较(因为j初始值为-1)//如果失配就执行跳转。直到j为-1为止。while( (j+1>0)&&(t[j+1]!=t[i]) ) j = next[j] ;//如果匹配,则两个串的指针都增长if( t[j+1]==t[i] )+ 阅读全文
摘要:
大名鼎鼎的“背包问题”我不敢企及去探讨,最近初学,感觉背包及相关问题真乃博大精深,于是把自己初学的体会写下来,帮助那些跟我一样也许暂时还没有思路的人。本文的核心算法都是动态规划。【问题】与背包问题近似的经典动态规划题目有(附相应的wiki条目):背包问题(knapsack problem)http://en.wikipedia.org/wiki/Knapsack_problem找零问题(coin changing/change making)http://en.wikipedia.org/wiki/Change-making_problem子集和问题(subset sum)http://en. 阅读全文
摘要:
矩阵连乘也是经典的动态规划的例子,而且能比较明显的把原来子问题的复杂度从指数级降为O(n^3),算是效果明显。【分析】算法的分析请见参考资料,我就不重复写了。就是写代码的时候需要注意两点:(1)这个程序是自底向上的动态规划。因为我们在一个段[ i : j ]中进行划分的时候,那么必须下面的每一个小段必须已经生成了。如下图所示:所以不能采用传统的那种i和j从头到尾的遍历(这种双重循环一般只适合于从前向后生成,比如最长公共子序列等动态规划)。(2)一开始对书中的递推式m[i][j] = m[i][k] + m[k][j] + pi-1 * pk * pj中的后面三项很不理解。为什么会是三项呢?书中 阅读全文
摘要:
【问题】随机抽样问题表示如下:要求从N个元素中随机的抽取k个元素,其中N无法确定。这种应用的场景一般是数据流的情况下,由于数据只能被读取一次,而且数据量很大,并不能全部保存,因此数据量N是无法在抽样开始时确定的;但又要保持随机性,于是有了这个问题。所以搜索网站有时候会问这样的问题。这里的核心问题就是“随机”,怎么才能是随机的抽取元素呢?我们设想,买彩票的时候,由于所有彩票的中奖概率都是一样的,所以我们才是“随机的”买彩票。那么要使抽取数据也随机,必须使每一个数据被抽样出来的概率都一样。【解决】解决方案就是蓄水库抽样(reservoid sampling)。主要思想就是保持一个集合(这个集合中的 阅读全文