huangfox

冰冻三尺,非一日之寒!

  博客园 :: 首页 :: 博问 :: 闪存 :: 新随笔 :: 联系 :: 订阅 订阅 :: 管理 ::
  194 随笔 :: 4 文章 :: 106 评论 :: 105万 阅读

随笔分类 -  0-算法

摘要:原文地址:We need tool support for keyset pagination 1、offset的定义 …the rows are first sorted according to the <order by clause> and then limited by dropping 阅读全文
posted @ 2018-08-31 17:21 huangfox 阅读(424) 评论(0) 推荐(0) 编辑

摘要:ProblemDesign and implement a data structure for Least Recently Used (LRU) cache. It should support the following operations: get and set.get(key)- Ge... 阅读全文
posted @ 2015-03-05 16:09 huangfox 阅读(367) 评论(0) 推荐(0) 编辑

摘要:一)分词1)正向/逆向最大匹配算法典型:IKAnalyzer采用的是正向迭代最细粒度切分算法IKAnalyzer源码简单分析:http://www.cnblogs.com/huangfox/p/3282003.html2)字典树(trieTree)trieTree实现http://www.cnblogs.com/huangfox/archive/2012/04/27/2474185.html中文分词遇到的问题:a)标准trieTree节点采用数组存储指针,如果是英文a-z用26长度的数组表示,但是中文不能用这种存储方式,节点数组长度等于中文字数。(内存撑不住!)b)如何节点内部查询?采用数组进 阅读全文
posted @ 2014-01-17 18:14 huangfox 阅读(4127) 评论(0) 推荐(0) 编辑

摘要:BF(Bruce Force)算法可以说是模式匹配算法中最简单、最容易理解的一个。原理很简单。其基本思想是从主串的start位置开始与模式串进行匹配,如果相等,则继续比较后续字符,如果不相等则模式串回溯到开始位置,主串回溯到start+1位置,继续进行比较直至模式串的所有字符都已比较成功则匹配成功,或者主串所有的字符已经比较完毕,没有找到完全匹配的字串,则匹配失败。package com.fox;/** * @author huangfox * @data 2012-7-18 * @email huangfox009@126.com * @desc */public class BF { /. 阅读全文
posted @ 2012-07-18 16:23 huangfox 阅读(498) 评论(0) 推荐(0) 编辑

摘要:trie树的定义这里就不多说了,直接贴代码(代码大部分是参考别人的,修改了个别错误,并添加了一个最大匹配的方法)。package com.fox.analyzer;import java.util.ArrayList;import java.util.List;public class Trie { private Vertex root = new Vertex(); protected class Vertex { protected int words; // 单词个数 protected int prefixes; // 前缀个数 protected Vertex[] edges... 阅读全文
posted @ 2012-04-27 21:25 huangfox 阅读(6083) 评论(0) 推荐(2) 编辑

点击右上角即可分享
微信分享提示