上一页 1 ··· 4 5 6 7 8 9 10 11 12 ··· 32 下一页
摘要: 最大熵源码解读 先简要介绍一下最大熵,主要的参考资料是: 《自然语言处理的最大熵模型》常宝宝 《统计自然语言处理》第二章 《条件随机场综述》韩雪东 《Classical Probabilistic Models and Conditional Random Fields》 Roman Klinger 阅读全文
posted @ 2018-05-26 16:55 大熊猫同学 阅读(1112) 评论(0) 推荐(0) 编辑
摘要: 隐马尔可夫模型维特比算法详解 关于隐马尔可夫模型的维特比解码算法网上已有一大批文章介绍,故本文不再介绍。 本文主要是在读《自然语言处理简明教程》和看HanLP 中文人名识别源码过程中,对该算法的一次梳理,以防忘记。 隐马模型有三个问题,其中二个是: 给定HMM模型 $\lambda$ 和一个观察序列 阅读全文
posted @ 2018-05-13 21:37 大熊猫同学 阅读(2688) 评论(0) 推荐(0) 编辑
摘要: HanLP中人名识别分析 在看源码之前,先看几遍论文《基于角色标注的中国人名自动识别研究》 关于命名识别的一些问题,可参考下列一些issue: "名字识别的问题 387" "机构名识别错误" "关于层叠HMM中文实体识别的过程" HanLP参考博客: "词性标注" "层叠HMM Viterbi角色标 阅读全文
posted @ 2018-05-11 20:27 大熊猫同学 阅读(4493) 评论(0) 推荐(0) 编辑
摘要: HanLP二元核心词典解析 本文分析:HanLP版本1.5.3中二元核心词典的存储与查找。当词典文件没有被缓存时,会从文本文件CoreNatureDictionary.ngram.txt中解析出来存储到TreeMap中,然后构造start和pair数组,并基于这两个数组实现词共现频率的二分查找。当已 阅读全文
posted @ 2018-05-08 21:52 大熊猫同学 阅读(1879) 评论(0) 推荐(1) 编辑
摘要: HanLP用户自定义词典源码分析 1. 官方文档及参考链接 关于词典问题Issue,首先参考: "FAQ" 自定义词典其实是基于 规则 的分词,它的用法参考 "这个issue" 如果有些数量词、字母词需要分词,可参考: "P2P和C2C这种词没有分出来,希望加到主词库" 关于词性标注:可参考 "词性 阅读全文
posted @ 2018-05-04 20:00 大熊猫同学 阅读(4063) 评论(0) 推荐(0) 编辑
摘要: 贝叶斯推断之拉普拉斯近似 本文介绍使用拉普拉斯近似方法来求解贝叶斯后验概率分布。在上一篇文章: "贝叶斯推断之最大后验概率(MAP)" 中介绍了使用点估计法来求解后验概率分布,在文章中定义了后验概率分布公式: $$p(w|t,X)=\frac{p(t|X,w)p(w)}{p(t|X)}$$ 分母$p 阅读全文
posted @ 2018-04-15 21:08 大熊猫同学 阅读(12241) 评论(2) 推荐(1) 编辑
摘要: 贝叶斯推断之最大后验概率(MAP) 本文详细记录贝叶斯后验概率分布的数学原理,基于贝叶斯后验概率实现一个二分类问题,谈谈我对贝叶斯推断的理解。 1. 二分类问题 给定N个样本的数据集,用$X$来表示,每个样本$x_n$有两个属性,最终属于某个分类$t$ $t=\left\{0,1\right\}$ 阅读全文
posted @ 2018-04-14 20:04 大熊猫同学 阅读(10981) 评论(14) 推荐(4) 编辑
摘要: 问题描述 想在一个JAVA Class 向同一个Redis实例的不同 dbindex 写入数据,非常类似于StackOverflowe上的 "[How can select dbIndex when I use RedisTemplate in Spring Data Redis?" 。在 "这篇文 阅读全文
posted @ 2018-04-10 21:23 大熊猫同学 阅读(12297) 评论(1) 推荐(0) 编辑
摘要: 这篇文章记录使用spring boot starter redis访问Redis。Redis相关的的配置文件放在Resources目录下的application.yml文件中,如下所示: 首先在pom.xml中添加依赖: RedisTemplate配置 Spring boot默认能够使用 @Auto 阅读全文
posted @ 2018-04-09 19:46 大熊猫同学 阅读(4080) 评论(0) 推荐(1) 编辑
摘要: 由于需要访问MongoDB,但是本地开发环境不能直接连接MongoDB,需要通过SecureCRT使用127.0.0.2本地IP代理。但是程序部署到线上生产环境后,是可以直接访问MongoDB的,因此开发好程序后,总是要修改一下MongoDB服务器的IP才能提交代码,这样很是不方便。 由于没有使用s 阅读全文
posted @ 2018-04-04 21:23 大熊猫同学 阅读(4493) 评论(0) 推荐(0) 编辑
上一页 1 ··· 4 5 6 7 8 9 10 11 12 ··· 32 下一页