08 2019 档案
摘要:Kaggle上有免费供大家使用的GPU计算资源,本文教你如何使用它来训练自己的神经网络。 Kaggle是什么 Kaggle是一个数据建模和数据分析竞赛平台。企业和研究者可在其上发布数据,统计学者和数据挖掘专家可在其上进行竞赛以产生最好的模型。 在Kaggle,你可以: 参加竞赛赢取奖金。Kaggle
阅读全文
摘要:版权声明:本文为博主原创文章,遵循 CC 4.0 by-sa 版权协议,转载请附上原文出处链接和本声明。 本文链接:https://blog.csdn.net/weixin_39777626/article/details/79673052 模型原型 partial_fit(X,y,classes=
阅读全文
摘要:一句话解释numpy.meshgrid()——生成网格点坐标矩阵。 关键词:网格点,坐标矩阵 网格点是什么?坐标矩阵又是什么鬼? 看个图就明白了: 图中,每个交叉点都是网格点,描述这些网格点的坐标的矩阵,就是坐标矩阵。 再看个简单例子 A,B,C,D,E,F是6个网格点,坐标如图,如何用矩阵形式(坐
阅读全文
摘要:版权声明:本文为博主原创文章,遵循 CC 4.0 by-sa 版权协议,转载请附上原文出处链接和本声明。 本文链接:https://blog.csdn.net/kevinelstri/article/details/52622960 【scikit-learn】01:使用案例对sklearn库进行简
阅读全文
摘要:sklearn.datasets.make_blobs(n_samples=100, n_features=2, centers=3, cluster_std=1.0, center_box=(-10.0, 10.0), shuffle=True, random_state=None) 属性含义:
阅读全文
摘要:Bagging 从原始样本集中抽取训练集。每轮从原始样本集中使用Bootstraping(有放回)的方法抽取n个训练样本(在训练集中,有些样本可能被多次抽取到,而有些样本可能一次都没有被抽中)。共进行k轮抽取,得到k个训练集。(我们这里假设k个训练集之间是相互独立的,事实上不是完全独立) 每次使用一
阅读全文
摘要:sklearn集成方法 bagging 常见变体(按照样本采样方式的不同划分) Pasting:直接从样本集里随机抽取的到训练样本子集 Bagging:自助采样(有放回的抽样)得到训练子集 Random Subspaces:列采样,按照特征进行样本子集的切分 Random Patches:同时进行行
阅读全文
摘要:分类模型评估: 指标描述Scikit-learn函数 Precision 精准度 from sklearn.metrics import precision_score Recall 召回率 from sklearn.metrics import recall_score F1 F1值 from s
阅读全文
摘要:分类问题的评价指标是准确率,那么回归算法的评价指标就是MSE,RMSE,MAE、R-Squared。下面一一介绍 均方误差(MSE) MSE (Mean Squared Error)叫做均方误差。看公式 这里的y是测试集上的。 用 真实值-预测值 然后平方之后求和平均。 猛着看一下这个公式是不是觉得
阅读全文
摘要:版权声明:本文为博主原创文章,遵循 CC 4.0 by-sa 版权协议,转载请附上原文出处链接和本声明。 本文链接:https://blog.csdn.net/wsp_1138886114/article/details/80552230 <!-- flowchart 箭头图标 勿删 --> 集成学
阅读全文
摘要:https://www.cnblogs.com/Lin-Yi/p/10387648.html 为什么要做归一化或者标准化? 主要是为了调整样本数据每个维度的量纲,让每个维度数据量纲相同或接近。 为什么要调整量纲?目的是什么? 1 量纲不一样的情况是什么? 比如一个2分类任务,预测一批零件是合格品还是
阅读全文
摘要:关于标准化(standardization) 数据标准化能将原来的数据进行重新调整(一般也称为 z-score 规范化方法),以便他们具有标准正态分布的属性,即 μ=0 和 σ=1。其中,μ 表示平均值,σ 表示标准方差。数据标准化之后的形式可以按照如下公式进行计算: 如果我们是比较两个不同大小维度
阅读全文
摘要:#数据标准化#StandardScaler (基于特征矩阵的列,将属性值转换至服从正态分布)#标准化是依照特征矩阵的列处理数据,其通过求z-score的方法,将样本的特征值转换到同一量纲下#常用与基于正态分布的算法,比如回归 #数据归一化#MinMaxScaler (区间缩放,基于最大最小值,将数据
阅读全文
摘要:案例: from sklearn import treefrom IPython.display import Imageimport pydotplusdot_data = tree.export_graphviz(model, out_file=None, filled=True, rounde
阅读全文
摘要:前面的博客里有提到决策树,我们也了解了决策树的构建过程,如果可以可视化决策树,把决策树打印出来,对我们理解决策树的构建会有很大的帮助。这篇文章中,我们就来看下如何可视化输出一棵决策树。 一、安装相应的插件 我们需要安装Graphviz和pygraphviz,教程,这个教程里有详细的安装过程,这里就不
阅读全文
摘要:尽管近年来神经网络复兴并大为流行,但是 boosting 算法在训练样本量有限、所需训练时间较短、缺乏调参知识等场景依然有其不可或缺的优势。本文从算法结构差异、每个算法的分类变量时的处理、算法在数据集上的实现等多个方面对 3 种代表性的 boosting 算法 CatBoost、Light GBM
阅读全文
摘要:写在前面 Ensemble methods 组合模型的方式大致为四个:/bagging / boosting / voting / stacking ,此文主要简单叙述 bagging算法。 算法主要特点 Bagging: 平行合奏:每个模型独立构建 旨在减少方差,而不是偏差 适用于高方差低偏差模型
阅读全文
摘要:ElasticSearch是一个基于Lucene的搜索服务器。它提供了一个分布式多用户能力的全文搜索引擎,基于RESTful web接口。Elasticsearch是用Java语言开发的,并作为Apache许可条款下的开放源码发布,是一种流行的企业级搜索引擎。ElasticSearch用于云计算中,
阅读全文
摘要:关于数据预处理的几个概念 归一化 (Normalization): 属性缩放到一个指定的最大和最小值(通常是1-0)之间,这可以通过preprocessing.MinMaxScaler类实现。 常用的最小最大规范化方法(x-min(x))/(max(x)-min(x)) 除了上述介绍的方法之外,另一
阅读全文
摘要:http://liao.cpython.org/pandas15/ Docs » Pandas的Categorical Data类型 15. Pandas的Categorical Data pandas从0.15版开始提供分类数据类型,用于表示统计学里有限且唯一性数据集,例如描述个人信息的性别一般就
阅读全文
摘要:创建容器 容器就是win32程序运行的环境,可以理解为一个极小的windows,在Linux下面实际对应一个文件目录,如QQ对应的容器目录是~/.deepinwine/Deepin-QQ。 创建容器最简单实用的方法就是将deepin维护的容器拷贝一份,如将QQ的容器拷贝一份到用户目录。cp -r ~
阅读全文
摘要:梯度下降法(Gradient Descent) 优化思想:用当前位置的负梯度方向作为搜索方向,亦即为当前位置下降最快的方向,也称“最速下降法”。越接近目标值时,步长越小,下降越慢。 如下图所示,梯度下降不一定能找到全局最优解,可能寻找到的是局部最优解。(当损失函数是凸函数时,梯度下降得到的解一定是全
阅读全文
摘要:实现:# -*- coding: UTF-8 -*- import numpy as npfrom sklearn.linear_model import SGDRegressor__author__ = 'zhen'X = 2 * np.random.rand(100, 1)y = 4 + 3 *
阅读全文
摘要:版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/qq_21904665/article/details/52315642 ElasticNet 是一种使用L1和L2先验作为正则化矩阵的线性回归模型.这种组合用于只有很少的权重非零的稀疏模型,比如:cl
阅读全文
摘要:<!-- flowchart 箭头图标 勿删 --> 语法: ElasticNet(self, alpha=1.0, l1_ratio=0.5, fit_intercept=True, normalize=False, precompute=False, max_iter=1000, copy_X=
阅读全文
摘要:版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/aristolto/article/details/77370853 之前使用的是Qt4.7后来换成了Qt5.x,Qtcreator的版本使用4.0,使用中发现Qtcreator远程调试出现“The s
阅读全文
摘要:<!-- flowchart 箭头图标 勿删 --> 目标函数 Lasso相当于带有L1正则化项的线性回归。先看下目标函数:RSS(w)+λ∥w∥1=∑Ni=0(yi−∑Dj=0wjhj(xi))2+λ∑Dj=0∣wj∣RSS(w)+λ∥w∥1=∑i=0N(yi−∑j=0Dwjhj(xi))2+λ∑
阅读全文
摘要:http://www.cnblogs.com/pinard/p/6018889.html 本文将用一个例子来讲述怎么用scikit-learn和pandas来学习Ridge回归。 1. Ridge回归的损失函数 在我的另外一遍讲线性回归的文章中,对Ridge回归做了一些介绍,以及什么时候适合用 Ri
阅读全文
摘要:from sklearn import datasets from sklearn.model_selection import train_test_split from sklearn.model_selection import GridSearchCV from sklearn.metric
阅读全文
摘要:一、GridSearchCV介绍: 自动调参,适合小数据集。相当于写一堆循环,自己设定参数列表,一个一个试,找到最合适的参数。数据量大可以使用快速调优的方法 坐标下降【贪心,拿当前对模型影响最大的参数调优,直到最优,但可能获得的是全局最优】。 二、参数使用 class sklearn.model_s
阅读全文
摘要:SFTP称作“安全的FTP”,它使用ssh文件传输协议。所以我们需要安装openssh-server ubuntu自带的有openssh-client,所以可以通过 ssh username@host 来远程连接linux。 可是要想通过ssh被连接,ubuntu系统需要有openssh-serve
阅读全文
摘要:引用 vi /etc/ssh/sshd_config 将PermitRootLogin项改为yes service sshd restart 重启sshd服务即可 vi /etc/ssh/sshd_config 将PermitRootLogin项改为yes service sshd restart
阅读全文
摘要:版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/libaineu2004/article/details/62423830 尊重作者,支持原创,如需转载,请附上原地址:http://blog.csdn.net/libaineu2004/article
阅读全文
摘要:用python写爬虫时,BeautifulSoup真是解析html,快速获取所需数据的神器。 这个美味汤使唤起来,屡试不爽。 在用find()方法找到特定的tag后,想获取里面的文本,可以用.text属性或者.string属性。 在很多时候,两者的返回结果一致,但其实两者是有区别的。 .string
阅读全文
摘要:序 Beautiful Soup 是一个可以从HTML或XML文件中提取数据的Python库.它能够通过你喜欢的转换器实现惯用的文档导航,查找,修改文档的方式.Beautiful Soup会帮你节省数小时甚至数天的工作时间。 Beautiful Soup支持Python标准库中的HTML解析器,还支
阅读全文