摘要: 同样是使用NLTK来实现,NLTK的安装之前博文有说过在此不再赘述。 http://www.cnblogs.com/mansiisnam/p/5301892.html 之前在网上找了很多实现最大熵+LBFGS的资料,也看了大牛自己写代码实现出来的博客。但是本人的基础薄弱难以对大牛的代码进行修改以达到 阅读全文
posted @ 2016-08-23 17:17 mansiisnam 阅读(2021) 评论(1) 推荐(1) 编辑
摘要: 之前零零散散用过几次,配置好了就没管过。后来再用的时候就忘了怎么配置,又找了很多资料(太麻烦了)。现总结一下当作笔记: 首先,下载中科院分词项目。 github网址:https://github.com/NLPIR-team/NLPIR/tree/master/NLPIR%20SDK/NLPIR-I 阅读全文
posted @ 2016-07-13 14:25 mansiisnam 阅读(2438) 评论(0) 推荐(0) 编辑
摘要: 上一节介绍了使用OpenNLP训练命名实体识别模型的方法,并将模型写到磁盘上形成二进制bin文件,这一节就是将模型从磁盘上载入,然后进行命名实体识别。依然是先上代码: [java] view plain copy import java.io.File; import java.util.HashM 阅读全文
posted @ 2016-04-06 19:33 mansiisnam 阅读(992) 评论(0) 推荐(0) 编辑
摘要: 原文地址:http://blog.csdn.net/qdhy199148/article/details/51038637 OpenNLP是Apach下的Java自然语言处理API,功能齐全,但是网上似乎能找到的用于处理中文的资料很少。 正好前段时间面试遇到一个做命名实体识别的任务考题,这里来给大家 阅读全文
posted @ 2016-04-06 19:31 mansiisnam 阅读(1204) 评论(0) 推荐(0) 编辑
摘要: 层次分析法(AHP) 美国运筹学家A.L.Saaty于本世纪70年代提出的层次分析法(Analytical Hierar-chy Process,简称AHP方法),是一种定性与定量相结合的决策分析方法。它是一种将决策者对复杂系统的决策思维过程模型化、数量化的过程。 具体的方法介绍在这个ppt上有详细 阅读全文
posted @ 2016-03-30 12:24 mansiisnam 阅读(2287) 评论(0) 推荐(0) 编辑
摘要: 代码中使用了NLTK库 NLTK安装教程如下: http://www.hankcs.com/nlp/window-7-64%E4%BD%8D-python-2-7-nltk-%E5%AE%89%E8%A3%85.html 训练数据: http://files.cnblogs.com/files/ma 阅读全文
posted @ 2016-03-21 14:52 mansiisnam 阅读(1319) 评论(0) 推荐(0) 编辑
摘要: 原文地址:http://www.cnblogs.com/limengqiang/archive/2013/01/16/KettleApply1.html 本系列文章主要索引如下: 一、ETL利器Kettle实战应用解析系列一【Kettle使用介绍】 二、ETL利器Kettle实战应用解析系列二 【应 阅读全文
posted @ 2016-03-02 09:05 mansiisnam 阅读(213) 评论(0) 推荐(0) 编辑
摘要: 原文地址:http://www.cnblogs.com/lutingting/p/4970651.html deeplearning4j是基于java的深度学习库,当然,它有许多特点,但暂时还没学那么深入,所以就不做介绍了 需要学习dl4j,无从下手,就想着先看看官网的examples,于是,下载了 阅读全文
posted @ 2016-03-01 10:45 mansiisnam 阅读(4496) 评论(0) 推荐(0) 编辑
摘要: 常用特征选择方法:本文为自身学习笔记参考了如下博文及论文http://www.blogjava.net/zhenandaci/archive/2009/03/24/261701.htmlhttp://blog.sina.com.cn/s/blog_6622f5c30101datu.htmlhttp:... 阅读全文
posted @ 2015-12-03 16:53 mansiisnam 阅读(1368) 评论(0) 推荐(0) 编辑
摘要: 前提:首先说明一下TFIDF的部分是借用http://www.cnblogs.com/ywl925/archive/2013/08/26/3275878.html这篇博文写的代码,因为工作需要在后面加上了使用信息增益的方法进行特征降维。TFIDF的介绍在此就不赘述了,直接将公式摆出来。TF公式:以上... 阅读全文
posted @ 2015-06-15 16:28 mansiisnam 阅读(4338) 评论(0) 推荐(0) 编辑