摘要: 分类的目标是,使得类别内的点距离越近越好(集中),类别间的点越远越好。 在机器学习领域,不少的地方都要用到特征值的计算,比如说图像识别、pagerank、LDA、PCA等等。 LDA是最简单的线性分类器,可以看做是简化版的SVM。LDA和PCA有较强的相关性,从推导、求解到算法最终的结果都有相当的相 阅读全文
posted @ 2016-02-18 10:40 python挖掘 阅读(170) 评论(0) 推荐(0) 编辑
摘要: 在开发“零模型置乱”时,遇到该错误 'ascii' codec can't decode byte 0xe6 in position 25: ordinal not in range(128), 其实跟编解码无关,完全是程序bug, 断边重连时要断开的边不存在导致的 阅读全文
posted @ 2016-02-18 10:38 python挖掘 阅读(110) 评论(0) 推荐(0) 编辑
摘要: http://bbs.pkbigdata.com/topic/32573ad1120342cca9127811cfc870c8.html http://bbs.pkbigdata.com/topic/73dda4cb230b4fdc9657b04f96050b0e.html http://bbs.p 阅读全文
posted @ 2016-02-18 10:20 python挖掘 阅读(272) 评论(0) 推荐(0) 编辑
摘要: 降维 参考网址http://dataunion.org/20803.html 【低方差滤波 (Low Variance Filter)】需先对数据做归一化处理 【高相关滤波】认为当两列数据变化趋势相似时,它们包含的信息也相似 【随机森林】对目标属性产生许多巨大的树,然后根据对每个属性的统计结果找到信 阅读全文
posted @ 2016-02-18 10:19 python挖掘 阅读(405) 评论(0) 推荐(0) 编辑
摘要: bin -将整数转换为二进制。 eg:光棍的悲哀 http://www.pythontip.com/coding/code_oj_case/13 enumerate - 枚举 np.meshgrid - 参考http://docs.scipy.org/doc/numpy/reference/gene 阅读全文
posted @ 2016-02-18 10:03 python挖掘 阅读(118) 评论(0) 推荐(0) 编辑