罗马圣剑 - 博客园

计算字符串相似度算法——Levenshtein

摘要： 0.这个算法实现起来很简单1.百度百科介绍：Levenshtein 距离，又称编辑距离，指的是两个字符串之间，由一个转换成另一个所需的最少编辑操作次数。许可的编辑操作包括将一个字符替换成另一个字符，插入一个字符，删除一个字符。编辑距离的算法是首先由俄国科学家Levenshtein提出的，故又叫Lev... 阅读全文

posted @ 2015-04-14 00:57 罗马圣剑阅读(149) 评论(0) 推荐(0) 编辑

Maximum Likelihood 最大似然估计

摘要： Maximum Likelihood 最大似然估计这个算法解决的问题是，当我们知道一组变量的密度分布函数与从总体采样的个体的时候，需要估计函数中的某些变量。假设概率密度函数如下：一般来说，为了计算的方便性，我们会采取对数的方式现在的目标是要使得上面函数取最大值，自变量为Θ，并且可以是一个向量。求上面... 阅读全文

posted @ 2015-04-01 21:46 罗马圣剑阅读(148) 评论(0) 推荐(0) 编辑

Laplacian eigenmap 拉普拉斯特征映射

摘要：下面是实验室大牛师兄自己写的一段总结，主要内容是Laplacian Eigenmap中的核心推导过程。有空还是多点向这位师兄请教，每次都会捡到不少金子。Reference : 《Laplacian Eigenmaps for Dimensionality Reduction and Data Rep... 阅读全文

posted @ 2014-11-05 00:03 罗马圣剑阅读(1419) 评论(0) 推荐(0) 编辑

SparseLDA算法

摘要： 2 SparseLDA算法本章将介绍一种Gibbs Sampling算法的加速算法——SparseLDA [9]，它主要利用LDA 模型的稀疏性，来达到加速以及节省内存的目的，是一种精确算法（没有近似）。2.1 背景q(z)=ntk,¬i+βnk,¬i+βV(nkm,¬i+αk)(1)在介绍具体的算... 阅读全文

posted @ 2014-10-28 20:37 罗马圣剑阅读(710) 评论(0) 推荐(0) 编辑

eigenvalues problem

摘要：由于在看paper中经常会看到generalized eigenvalues、eigenvalues problem等字眼，今晚终于开始认真地重新看了一下线性代数中这部分内容。下面是在学习过程中找出来的资料：广义特征值问题的特征值，用以解决最优化问题，如 Ax=lamb*Bx：http://wenk... 阅读全文

posted @ 2014-10-25 00:11 罗马圣剑阅读(206) 评论(0) 推荐(0) 编辑

kernel function

摘要：下面这张图位于第一、二象限内。我们关注红色的门，以及“北京四合院”这几个字下面的紫色的字母。我们把红色的门上的点看成是“+”数据，紫色字母上的点看成是“-”数据，它们的横、纵坐标是两个特征。显然，在这个二维空间内，“+”“-”两类数据不是线性可分的。我们现在考虑核函数，即“内积平方”。这里面是二维空... 阅读全文

posted @ 2014-10-19 20:31 罗马圣剑阅读(189) 评论(0) 推荐(0) 编辑

半监督学习[转]

摘要： 0 引言机器学习(machine learning)是人工智能的核心研究领域，是智能信息处理的重要途径。监督学习(supervised learning)是机器学习中研究最多、应用最广泛的一种学习途径。在传统的监督学习中，学习系统通过对大量的有标记训练样本(labeled examples)进行学习... 阅读全文

posted @ 2014-10-17 21:45 罗马圣剑阅读(347) 评论(0) 推荐(0) 编辑

self-training and co-training

摘要：半指导学习（Semi-supervised Learning）的概念说起来一点儿也不复杂，即从同时含有标注数据和未标注数据的训练集中学习模型。半指导学习是介于有指导学习与无指导学习之间的一种机器学习方式。在NLP领域的很多任务中，标注数据其实是很难获取的。尤其像句法、语义等训练资源在标注时往往需要比... 阅读全文

posted @ 2014-10-17 17:24 罗马圣剑阅读(2971) 评论(1) 推荐(0) 编辑

机器学习10大经典算法

摘要： 1、C4.5机器学习中，决策树是一个预测模型；他代表的是对象属性与对象值之间的一种映射关系。树中每个节点表示某个对象，而每个分叉路径则代表的某个可能的属性值，而每个叶结点则对应从根节点到该叶节点所经历的路径所表示的对象的值。决策树仅有单一输出，若欲有复数输出，可以建立独立的决策树以处理不同输出。从数... 阅读全文

posted @ 2014-10-17 10:59 罗马圣剑阅读(383) 评论(0) 推荐(0) 编辑

修改ubuntu终端显示目录和计算机名称(转)

摘要：注意：使用方法：# PS1='自定义内容'注意两边的单引号示例： PS1='(\u@\H \d \t)\$'------------------------------------------------------------------------------------------------... 阅读全文

posted @ 2014-09-27 12:09 罗马圣剑阅读(161) 评论(0) 推荐(0) 编辑

lmsj918