随机森林是否需要交叉验证+特征的重要性
摘要:随机森林不需要交叉验证! 随机森林属于bagging集成算法,采用Bootstrap,理论和实践可以发现Bootstrap每次约有1/3的样本不会出现在Bootstrap所采集的样本集合中。故没有参加决策树的建立,这些数据称为袋外数据oob,歪点子来了,这些袋外数据可以用于取代测试集误差估计方法,可
阅读全文
深入理解Batch normalization 的作用
摘要:转载: https://www.cnblogs.com/wmr95/articles/9450252.html 这篇文章解释起来通俗易懂。方便后续自己查阅 Batch Normalization作为最近一年来DL的重要成果,已经广泛被证明其有效性和重要性。虽然有些细节处理还解释不清其理论原因,但是实
阅读全文
centos 安装python PIL模块
摘要:转载:https://www.cnblogs.com/ccdc/p/4069112.html 1、安装 使用yum安装缺少类库: 测试: 如果报缺少类库则手动安装: 下载资源: http://www.pythonware.com/products/pil/index.htm 下载最新版的PIL安装程
阅读全文
Centos6.8 安装dlib库时出错【升级gcc 到4.9.0以上】
摘要:在centos6.8上安装dlib库时出现错误: 1、CMake must be installed to build the following extensions: dlib 没有安装CMake,需要安装CMake,如 yum install cmake 2、Unsupported compi
阅读全文
TensorFlow—softmax_cross_entropy_with_logits函数详解
摘要:softmax_cross_entropy_with_logits函数原型: tf.nn.softmax_cross_entropy_with_logits(labels=y, logits=pred, name=None)函数功能:计算最后一层是softmax层的cross entropy,把so
阅读全文
异常点检查方法
摘要:奇异点、异常点检查 定义: 1)、novelty detection:当训练数据中没有离群点,我们的目标是用训练好的模型去检测另外新发现的样本; 2)、outlier detection:当训练数据中包含离群点,模型训练时要匹配训练数据的中心样本,忽视训练样本中的其它异常点; sklearn提供了一
阅读全文
机器学习
摘要:机器学习占位 1、Adaboost训练误差推导:https://www.jianshu.com/p/bfba5a91ba15
阅读全文
Scikit Learn安装教程
摘要:Windows下安装scikit-learn 准备工作 Python (>= 2.6 or >= 3.3), Numpy (>= 1.6.1) Scipy (>= 0.9), Matplotlib(可选). NumPy NumPy系统是Python的一种开源的数值计算扩展。这种工具可用来存储和处理大
阅读全文