摘要:原文地址:We need tool support for keyset pagination 1、offset的定义 …the rows are first sorted according to the <order by clause> and then limited by dropping
阅读全文
随笔分类 - 0-算法
摘要:ProblemDesign and implement a data structure for Least Recently Used (LRU) cache. It should support the following operations: get and set.get(key)- Ge...
阅读全文
摘要:一)分词1)正向/逆向最大匹配算法典型:IKAnalyzer采用的是正向迭代最细粒度切分算法IKAnalyzer源码简单分析:http://www.cnblogs.com/huangfox/p/3282003.html2)字典树(trieTree)trieTree实现http://www.cnblogs.com/huangfox/archive/2012/04/27/2474185.html中文分词遇到的问题:a)标准trieTree节点采用数组存储指针,如果是英文a-z用26长度的数组表示,但是中文不能用这种存储方式,节点数组长度等于中文字数。(内存撑不住!)b)如何节点内部查询?采用数组进
阅读全文
摘要:BF(Bruce Force)算法可以说是模式匹配算法中最简单、最容易理解的一个。原理很简单。其基本思想是从主串的start位置开始与模式串进行匹配,如果相等,则继续比较后续字符,如果不相等则模式串回溯到开始位置,主串回溯到start+1位置,继续进行比较直至模式串的所有字符都已比较成功则匹配成功,或者主串所有的字符已经比较完毕,没有找到完全匹配的字串,则匹配失败。package com.fox;/** * @author huangfox * @data 2012-7-18 * @email huangfox009@126.com * @desc */public class BF { /.
阅读全文
摘要:trie树的定义这里就不多说了,直接贴代码(代码大部分是参考别人的,修改了个别错误,并添加了一个最大匹配的方法)。package com.fox.analyzer;import java.util.ArrayList;import java.util.List;public class Trie { private Vertex root = new Vertex(); protected class Vertex { protected int words; // 单词个数 protected int prefixes; // 前缀个数 protected Vertex[] edges...
阅读全文