摘要:
集成学习之Boosting —— AdaBoost原理 集成学习之Boosting —— AdaBoost实现 AdaBoost的一般算法流程 输入: 训练数据集 \(T = \left \{(x_1,y_1), (x_2,y_2), \cdots (x_N,y_N)\right \}\),\(y\ 阅读全文
摘要:
在集成学习中,通常认为Bagging的主要作用是降低方差,而Boosting的主要作用是降低偏差。Boosting能降低偏差很好理解,因为其原理就是将多个弱学习器组合成强学习器。但Bagging为什么能降低方差?或者说,为什么将多个强学习器组合起来方差就会降低?这是本篇想要探讨的问题,而在这之前我认 阅读全文
摘要:
官方网站 官方代码 第一章 基础 1.1 基础编程模型 1.1节的内容主要为介绍Java的基本语法以及书中会用到的库。 下图为一个Java程序示例和相应的注解: 本书用到的几种基本语法: 初始数据类型 (primitive data tyoes):整型 (int),浮点型 (double),布尔型 阅读全文
摘要:
"代码" 损失函数的一般表示为$L(y,f(x))$,用以衡量真实值$y$和预测值$f(x)$之间不一致的程度,一般越小越好。为了便于不同损失函数的比较,常将其表示为单变量的函数,在回归问题中这个变量为$y f(x)$,在分类问题中则为$yf(x)$。下面分别进行讨论。 回归问题的损失函数 回归问题 阅读全文
摘要:
"numpy.where ( condition [, x , y ])" numpy.where() 有两种用法: 1. np.where(condition, x, y) 满足条件(condition),输出x,不满足输出y。 如果是一维数组,相当于 上面这个例子的条件为 ,分别对应最后输出结果 阅读全文
摘要:
完整代码见 "kaggle kernel" 或 "Github" 比赛页面:https://www.kaggle.com/c/house prices advanced regression techniques 这个比赛总的情况就是给你79个特征然后根据这些预测房价 (SalePrice),这其中 阅读全文
摘要:
"机器学习之类别不平衡问题 (1) —— 各种评估指标" 机器学习之类别不平衡问题 (2) —— ROC和PR曲线 "机器学习之类别不平衡问题 (3) —— 采样方法" " 完整代码 " ROC曲线和PR(Precision Recall)曲线皆为类别不平衡问题中常用的评估方法,二者既有相同也有不同 阅读全文
摘要:
机器学习之类别不平衡问题 (1) —— 各种评估指标 "机器学习之类别不平衡问题 (2) —— ROC和PR曲线" "机器学习之类别不平衡问题 (3) —— 采样方法" " 完整代码 " 在二分类问题中,通常假设正负类别相对均衡,然而实际应用中类别不平衡的问题,如100, 1000, 10000倍的 阅读全文
摘要:
具体症状为卡在开机界面,按任何键都无反应。 网上查看了几篇文章 ,如下: " 解决:ubuntu16.04启动时长时间停留在紫屏或跳文本的黑屏界面" "Ubuntu16.04显卡驱动 电源管理" 里面提到的开机进grub在Splah后加 nomodeset,我试了下没用。也试过更新显卡驱动,照样紫屏 阅读全文
摘要:
原文: https://www.economist.com/sites/default/files/ai_mailout.pdf 我对这篇文章的一些个人解读:http://www.cnblogs.com/massquantity/p/8323665.html 害怕新机器某一天会取代所有人的工作、只选 阅读全文