摘要: LDA是一个关于语料的生成概率模型,基本思想是文档可以表达为隐含主题的随机混合,每个主题刻画为关于词语的分布。LDA假设在语料D中生成一篇文章w的过程如下:1.根据泊松分布选在文章长度N2. 选择主题分布3. 对于每一个词Wn (a)根据多项式分布选择一个主题 (b)根据多项式条件概率分布选... 阅读全文
posted @ 2014-06-16 10:41 范志军 阅读(472) 评论(0) 推荐(0) 编辑
摘要: #include #include #include #include #include #define BUFF_LEN 1024using namespace std;long file_len(string file_name);void init(string file_name){}voi... 阅读全文
posted @ 2014-05-01 17:11 范志军 阅读(170) 评论(0) 推荐(0) 编辑
摘要: CC = g++ CFLAGS = -g -Wall SRC = ../src/INCLUDE = -I../includeOBJS = $(SRC)matrix.oOBJS_PP = $(SRC)regression.o $(SRC)utils.oLIB = TARGET = ../bin/regression$(TARGET) : $(OBJS) $(OBJS_PP)$(CC) -o $(TARGET) $(OBJS) $(OBJS_PP) $(LIB)$(OBJS) : $(SRC)%.o : $(SRC)%.c$(CC) $(CFLAGS) $(INCLUDE) -c $< -o 阅读全文
posted @ 2013-09-07 09:26 范志军 阅读(158) 评论(0) 推荐(0) 编辑
摘要: 最近一段时间再想一个问题,自己能不能够将事情再扎实一点,为什么在关键时刻总是忘记实现细节呢?为什么连2+3=5这样的问题也都忘记了怎么去求?居然弄不清楚二叉树前中后序遍历的差别,居然弄不清楚堆中删除元素的过程,居然弄不清楚快速排序的时间复杂度是nlog(n),我真的不知道说你什么好了。这样的东西即使在做梦的时候也应该能够明白吧,这些东西都是大一时候学习的,后来又不断的重复怎么就不会呢?这我有点不理解! 阅读全文
posted @ 2013-08-15 13:04 范志军 阅读(219) 评论(0) 推荐(0) 编辑
摘要: #include <stdio.h>int grid[9][9];int grid_tt[9][9];void file_init(FILE *src_f) { char *sp = "---------------------"; int g[9][9], i, j; char split[strlen(sp) + 1]; for (i = 0; i < 9; i++) {if (i == 3 || i == 6) fscanf(src_f, "%s", split); for (j = 0; j < 9; j++) { if 阅读全文
posted @ 2013-02-11 18:49 范志军 阅读(373) 评论(0) 推荐(0) 编辑
摘要: 就目前我总结到的矩阵分解有三种形式:矩阵对角化分解奇异值分解乔里斯基(Cholesky)分解下面分别简单介绍上面三个分解算法:1. 对角化分解:定义:一个n*n矩阵A如果可以写为X-1AX=D,其中x是可逆矩阵,D为对角矩阵,那么我们说A可以对角化。定理:如果一个矩阵可以对角化分解,那么A的n个特征向量就一定线性独立,反过来也成立。性质:An=XDnX-1 这是一个非常重要的性质,它和随机过程,马尔科夫过程有紧密的联系。我们熟知的PageRank算法中就应用了矩阵的对角化分解。2. 奇异值分解大家知道奇异值分解师应用最广的一个数学模型,在特征提取,图片压缩,主成因分析等都用到了奇异值分解。定义 阅读全文
posted @ 2013-01-28 09:52 范志军 阅读(3442) 评论(0) 推荐(0) 编辑
摘要: find ./ -name .svn -exec rm -rf {} \; 阅读全文
posted @ 2012-12-07 17:11 范志军 阅读(151) 评论(0) 推荐(0) 编辑
摘要: 当两个随机变量X,Y不独立,我们就会关心两个随机变量之间的关系到底有多大。 协方差定义:Cov(X,Y) = E[(X-ux)(Y-uy)] = 基本原理定义如下:假设X和Y相互之间有正相关性,那么当X增大同时Y也随着增大,而X减小时Y也随着减小。与之相关的(X-ux)和(Y-uy)要不就全为正,要么就全部为负值,所以(X-ux)(Y-uy)的值永远为正。所以对于正相关的关系,协方差也为正。相反,如果X,Y是负相关,(X-ux)和(Y-uy)的符号就会相反,乘积为负。所以对于负相关的两个随机变量其协方差为负。如果两个随机变量没有关系,那么协方差的值趋向于0. 阅读全文
posted @ 2012-09-11 09:54 范志军 阅读(366) 评论(0) 推荐(0) 编辑