上一页 1 2 3 4 5 6 7 ··· 70 下一页

2020年1月1日

什么是归一化和标准化

摘要: 归一化(Rescaling,max-min normalization,有的翻译为离差标准化)是指将数据缩放到[0,1]范围内,公式如下: X' = [X - min(X)] / [max(X) - min(X)] 标准化(Standardization, Z-score normalization 阅读全文

posted @ 2020-01-01 23:33 张叫兽的技术研究院 阅读(7203) 评论(0) 推荐(0) 编辑

正则化L1和L2

摘要: 基于距离的norm1和norm2 所谓正则化,就是在损失函数中增加范数,那么老调重弹一下,所谓范数是指空间向量的大小距离之和,那么范数有值单一向量而言的范数,其实所谓单点向量其实是指指定向量到原点的距离。 d = Σ||xi||· 还有针对两个向量求距离的范数;那么作为距离,最常用到的就是马哈顿距离 阅读全文

posted @ 2020-01-01 16:13 张叫兽的技术研究院 阅读(1129) 评论(0) 推荐(0) 编辑

2019年12月26日

决策树 – 分类

摘要: 决策树算法 如何能够基于既有的数据来进行分类和回归?决策树是解决这类问题的机器学习模型。 解决思路是:通过样本特征的三个数字特征:1)满足特征值的样本数量;2)1)样本的分类各自数量有多该少;3)总的样本数量,来作为input参数,通过构建/选择的模型就计算出来该特征的指标,对于ID3而是信息增益, 阅读全文

posted @ 2019-12-26 20:38 张叫兽的技术研究院 阅读(564) 评论(0) 推荐(0) 编辑

分布式事务 - 2/ 3阶段式提交

摘要: 2/3阶段提交解决的问题是分布式数据操作一致性问题,即在不同节点间数据多个操作的原子性问题,比如在A节点的数据增加和B节点数据的减少需要原子操作。 解决方案:在各个分布式节点之上引入TC(Trancaction Coordinator),由TC进行最终commit操作协调,只有各个节点的预操作(pr 阅读全文

posted @ 2019-12-26 18:32 张叫兽的技术研究院 阅读(272) 评论(0) 推荐(0) 编辑

2019年12月25日

搜狗设置自定义短语

摘要: 希腊字母 alpha,4=αalpha,5=Αbeta,4=βbeta,5=Βgamma,4=γgamma,5=Γdelta,4=δdelta,5=Δepsilon,4=εepsilon,5=Εzeta,4=ζzeta,5=Ζeta,4=ηeta,5=Ηtheta,4=θtheta,5=Θiota, 阅读全文

posted @ 2019-12-25 22:54 张叫兽的技术研究院 阅读(453) 评论(0) 推荐(0) 编辑

2019年12月24日

假设检验

摘要: 什么是假设检验 什么是假设检验,简单的讲就是,首先我有一个某个领域的数据分布有一个预期,然后观测并获取到这个领域一组统计学的数据,那么这组数据到底是支持我的预期还是反对我的预期,为了回答这个问题就需要使用到假设检验。 假设检验的思路 那么检验的思路是什么呢? 1. 首先要假设我们观测到的统计数据是符合我们预期的数据分布的; 2. 然后我们要将数据分布的可能性进行二元划分,一元是大概率... 阅读全文

posted @ 2019-12-24 20:43 张叫兽的技术研究院 阅读(673) 评论(0) 推荐(0) 编辑

2019年12月17日

SVM – 回归

摘要: SVM的算法是很versatile的,在回归领域SVM同样十分出色的。而且和SVC类似,SVR的原理也是基于支持向量(来绘制辅助线),只不过在分类领域,支持向量是最靠近超平面的点,在回归领域,支持向量是那些距离拟合曲线(回归的目标函数/模型是拟合曲线)。 上图我们看到还有一个变量,是ϵ,ϵ决定了街道 阅读全文

posted @ 2019-12-17 10:44 张叫兽的技术研究院 阅读(1354) 评论(0) 推荐(0) 编辑

SVM – 核函数

摘要: 核函数的起源是对于线性不可分的分类情况,其实可以通过p次方多项式,及非线性模型进行分类;然后对于这类非线性多次方的,其实可以按照广义线性模型来进行升维变形,使之成为线性模型,这样就可以放到SVM中来进行处理了(svm只能处理非线性模型)。 但是升维之后是有维度爆炸现象的(二次方对应6维度,三次方对应 阅读全文

posted @ 2019-12-17 10:42 张叫兽的技术研究院 阅读(1312) 评论(0) 推荐(0) 编辑

SVM – 线性分类器

摘要: 感知机 要理解svm,首先要先讲一下感知机(Perceptron),感知机是线性分类器,他的目标就是通过寻找超平面实现对样本的分类;对于二维世界,就是找到一条线,三维世界就是找到一个面,多维世界就是要找到一个线性表达式,或者说线性方程: f(x) = ΣθiXi 表达式为0,就是超平面,用来做分界线 阅读全文

posted @ 2019-12-17 10:31 张叫兽的技术研究院 阅读(1125) 评论(0) 推荐(0) 编辑

2019年12月2日

aliyun手记

摘要: 阿里云里面购买的带宽是指外网带宽,内网默认是千兆带宽,做过I/O优化的则是万兆带宽。 修改密码实在更多(三个点)的那里进行修改的;修改密码(windows是administrator以及Linux是root用户)需要重启之后才会生效。 阅读全文

posted @ 2019-12-02 16:03 张叫兽的技术研究院 阅读(164) 评论(0) 推荐(0) 编辑

上一页 1 2 3 4 5 6 7 ··· 70 下一页

导航