摘要: 特征缩放 x' = (x min)/(max min) sklearn.preprocessing.MinMaxScaler 特征选择 filter and wrapper filter fast but ignore bias,sometimes miss the point. wrapper k 阅读全文
posted @ 2017-12-07 09:54 james.yj 阅读(447) 评论(0) 推荐(0) 编辑
摘要: 有数组a,要求去掉a所有为0的元素 a = [2,4,0,8,9,10,100,0,9,7] 1. Filter a= filter(None, a) 2. Lambada a = filter(lambda x: x != 0, a) 3. for for b in a: if b == 0: a 阅读全文
posted @ 2017-12-06 16:32 james.yj 阅读(23669) 评论(1) 推荐(0) 编辑
摘要: k means 目标是把n个观察对象分成k个聚类,属于每一个聚类的观察对象哟最小的均方差。 k means 算法基本步骤 (1) 从 n个数据对象任意选择 k 个对象作为初始聚类中心; (2) 根据每个聚类对象的均值(中心对象),计算每个对象与这些中心对象的距离;并根据最小距离重新对相应对象进行划分 阅读全文
posted @ 2017-12-06 09:44 james.yj 阅读(249) 评论(0) 推荐(0) 编辑
摘要: json串到java对象 1. 前端传入参数json字符串,格式如下: 2. 如何取某个属性的值 例如:取语文的值 3. 运行结果:88 阅读全文
posted @ 2017-11-30 18:13 james.yj 阅读(140) 评论(0) 推荐(0) 编辑
摘要: 非监督学习 非监督学习没有历史样本数据和标签,直接对数据分析或得结果。 k means 使用 k means重要参数 1. n_clusters 估计聚类的数量 2. n_init k means算法基于不同中心点运行的次数 3. max_tier k means一次运行的迭代次数,默认300,通常 阅读全文
posted @ 2017-11-30 10:01 james.yj 阅读(387) 评论(0) 推荐(0) 编辑
摘要: 贝叶斯公式 p(h|D) = p(D|h) p(h)/p(D) 例子 某人去某医院看病,该医院针对某人的病情进行癌症检测,检验结果为阳性的准确率为98%,检测结果为阴性的准确率为97%。 某人所在的人群调查结果显示,患上癌症的几率为0.8%。 如果某人的检测结果了阳性的情况下,这个人是否真的有癌症? 阅读全文
posted @ 2017-11-28 17:24 james.yj 阅读(587) 评论(0) 推荐(0) 编辑
摘要: Java移位运算种类 基础:我们知道在Java中int类型占32位,可以表示一个正数,也可以表示一个负数。正数换算成二进制后的最高位为0,负数的二进制最高为为1 例子: 5换算成二进制后为:1111 1111 1111 1111 1111 1111 1111 1011 负数的二进制如何换算过来的? 阅读全文
posted @ 2017-11-28 10:29 james.yj 阅读(236) 评论(0) 推荐(0) 编辑
摘要: 初始环境 在安装之前,我的anaconda2已经安装好,git也有装好 1. 下载相对应的xgboost.dll文件 "下载地址" 2. Installing the Python Wrapper for me: xgboost_install_dir = D:\Python\algorithm g 阅读全文
posted @ 2017-11-27 17:37 james.yj 阅读(1328) 评论(0) 推荐(0) 编辑
摘要: bagging 侧重于降低方差 1. 方差 variance 方差描述的是预测值的变化范围,离散程度,也就是离期真实值的距离。方差过大表现为过拟合,训练数据的预测f score很高,但是验证或测试数据的预测f score低很多。实际应用中表现为对新数据的泛化能力弱。例如:一个模型学习加减法运算,模型 阅读全文
posted @ 2017-11-27 10:20 james.yj 阅读(305) 评论(0) 推荐(0) 编辑
摘要: “one against one” approach “one vs the rest” multi class strategy 阅读全文
posted @ 2017-11-24 16:38 james.yj 阅读(1594) 评论(0) 推荐(0) 编辑