摘要: 用途 用来把一组数据分割成离散的区间。比如有一组年龄数据,可以使用 将年龄数据分割成不同的年龄段并打上标签。 原型 参数含义 :被切分的类数组(array like)数据,必须是1维的(不能用DataFrame); :bins是被切割后的区间(或者叫“桶”、“箱”、“面元”),有3中形式:一个int 阅读全文
posted @ 2018-12-17 22:24 ColdCode 阅读(52848) 评论(0) 推荐(6) 编辑
摘要: 在训练模型之前,我们通常都要对训练数据进行一定的处理。将类别编号就是一种常用的处理方法,比如把类别“男”,“女”编号为0和1。可以使用sklearn.preprocessing中的LabelEncoder处理这个问题。 作用 将n个类别编码为0~n 1之间的整数(包含0和n 1)。 例子 假设我们要 阅读全文
posted @ 2018-12-17 22:00 ColdCode 阅读(21153) 评论(0) 推荐(1) 编辑
摘要: 逻辑斯蒂回归(logistic regression,又称“对数几率回归”) 是经典的分类方法。虽然名字中包含回归,但它被用来 分类 。 逻辑斯蒂分布 设 $X$ 是随机变量,$X$ 服从逻辑斯蒂分布是指 $X$ 的概率分布函数 $F(x)$ 和概率密度函数 $f(x)$ 为: $$F(x) = P 阅读全文
posted @ 2018-11-04 21:39 ColdCode 阅读(4824) 评论(0) 推荐(0) 编辑
摘要: 决策树(decision tree)是一种基本的分类与回归方法。在训练过程中,根据训练数据的属性来建立一棵决策树,从而实现快速地分类和回归。这篇文章将会讨论用于 分类 的决策树。 决策树的定义 决策树由 结点(node) 和 有向边(directed edge) 组成。结点可以分为两种类型: 内部结 阅读全文
posted @ 2018-11-01 17:17 ColdCode 阅读(1427) 评论(0) 推荐(0) 编辑
摘要: 在机器学习中,我们通常会根据输入 $x$ 来预测输出 $y$,预测值和真实值之间会有一定的误差,我们在训练的过程中会使用优化器(optimizer)来最小化这个误差,梯度下降法(Gradient Descent)就是一种常用的优化器。 什么是梯度 梯度是一个向量,具有大小和方向。想象我们在爬山,从我 阅读全文
posted @ 2018-10-19 23:06 ColdCode 阅读(10809) 评论(1) 推荐(1) 编辑
摘要: numpy中的random模块包含了很多方法可以用来产生随机数,这篇文章将对random中的一些常用方法做一个总结。 1、numpy.random.rand(d0, d1, ..., dn) 作用 :产生一个给定形状的数组(其实应该是ndarray对象或者是一个单值),数组中的值服从[0, 1)之间 阅读全文
posted @ 2018-09-21 12:10 ColdCode 阅读(48593) 评论(1) 推荐(4) 编辑
摘要: npm 换源 使用npm下载包的时候有时候会出现下载速度非常慢的情况,原因是npm的默认仓库在国外,将仓库地址改为国内地址就行了。这里将源改为淘宝的镜像。 1、修改源地址为淘宝镜像 2、修改源地址为官方地址 当我们要发布自己的包的时候,需要将源地址切换为官方地址: conda 换源 添加conda的 阅读全文
posted @ 2018-09-06 09:53 ColdCode 阅读(625) 评论(0) 推荐(0) 编辑
摘要: 1、背景 首先说一下我的环境: "官网" 提供了两种方法来安装TensorFlow:pip和anaconda。我使用的是anaconda方法。按照步骤安装完成后,在命令行可以导入tensorflow,也可以运行程序,然后我在创建的名为tensorflow的环境中使用命令 启动jupyter note 阅读全文
posted @ 2018-08-27 15:42 ColdCode 阅读(22410) 评论(0) 推荐(3) 编辑
摘要: 1、感知机定义 如果输入是一个n维向量$x∈\mathbb{R}^n$,输出为样本的类别{+1, 1}。由输入到输出有以下函数:$$f(x)=sign(\omega·x+b)$$ 则称该函数为 感知机 。其中$\omega$和$b$为感知机参数,$\omega$被称为 权值 (weight)或者 权 阅读全文
posted @ 2018-08-24 22:29 ColdCode 阅读(702) 评论(0) 推荐(0) 编辑
摘要: 在matplotlib中使用函数 "matplotlib.pyplot.scatter" 绘制散点图,matplotlib.pyplot.scatter的函数签名如下: 常用参数有:x,y组成了散点的坐标;s为散点的面积;c为散点的颜色(默认为蓝色'b');marker为散点的标记;alpha为散点 阅读全文
posted @ 2018-08-23 11:20 ColdCode 阅读(48329) 评论(1) 推荐(3) 编辑
AmazingCounters.com