2016 年 2月 18 日随笔档案 - python挖掘

2016年2月18日

摘要：分类的目标是，使得类别内的点距离越近越好（集中），类别间的点越远越好。在机器学习领域，不少的地方都要用到特征值的计算，比如说图像识别、pagerank、LDA、PCA等等。 LDA是最简单的线性分类器，可以看做是简化版的SVM。LDA和PCA有较强的相关性，从推导、求解到算法最终的结果都有相当的相阅读全文

posted @ 2016-02-18 10:40 python挖掘阅读(170) 评论(0) 推荐(0) 编辑

遇到的问题小记

摘要：在开发“零模型置乱”时，遇到该错误 'ascii' codec can't decode byte 0xe6 in position 25: ordinal not in range(128)，其实跟编解码无关，完全是程序bug, 断边重连时要断开的边不存在导致的阅读全文

posted @ 2016-02-18 10:38 python挖掘阅读(110) 评论(0) 推荐(0) 编辑

kaggle

摘要： http://bbs.pkbigdata.com/topic/32573ad1120342cca9127811cfc870c8.html http://bbs.pkbigdata.com/topic/73dda4cb230b4fdc9657b04f96050b0e.html http://bbs.p 阅读全文

posted @ 2016-02-18 10:20 python挖掘阅读(272) 评论(0) 推荐(0) 编辑

sklearn学习札记

摘要：降维参考网址http://dataunion.org/20803.html 【低方差滤波 (Low Variance Filter)】需先对数据做归一化处理【高相关滤波】认为当两列数据变化趋势相似时，它们包含的信息也相似【随机森林】对目标属性产生许多巨大的树，然后根据对每个属性的统计结果找到信阅读全文

posted @ 2016-02-18 10:19 python挖掘阅读(405) 评论(0) 推荐(0) 编辑

python学习杂记

摘要： bin -将整数转换为二进制。 eg:光棍的悲哀 http://www.pythontip.com/coding/code_oj_case/13 enumerate - 枚举 np.meshgrid - 参考http://docs.scipy.org/doc/numpy/reference/gene 阅读全文

posted @ 2016-02-18 10:03 python挖掘阅读(118) 评论(0) 推荐(0) 编辑

come_on

公告