摘要: 本科做的题目就是模式识别。正好重温一下。首先对文本向量化,得到向量I, 例如是1*n的向量然后求协方差矩阵 = I*IT, 得到n*n的矩阵, 那么如果有M个文本,就可以得到 Sum(I*IT)(1~M)= AAT。然后降维处理,得到ATA。这2个矩阵的特征值是相同的,特征向量关系:f= A*v,f是前者的特征向量,v是后者的特征向量。由于我只有1个文本,所以变换后的矩阵是个数,本质就是这个矩阵的... 阅读全文
posted @ 2010-03-20 23:50 辰 阅读(629) 评论(0) 推荐(0) 编辑
摘要: 我靠!还真的过了1个月。。。。之前还1月。。现在就差不多4月了。上个月的目标:---------------1. 完成schedular框架(已经完成)2. 完成testdriven的框架,为程序开发打上双保险。3. 修改consistency,使用http协议,不用webservice,权限问题太严重了。4. 完成autoupdator框架,必须支持数据库的更新、xml的更新、文件系统的更新、a... 阅读全文
posted @ 2010-03-20 03:04 辰 阅读(390) 评论(20) 推荐(0) 编辑
IT民工