摘要: 一、简述 在某个条件下的两组数据,分别讨论时都会满足某种性质,可是一旦合并考虑,却可能导致相反的结论。 当人们尝试探究两种变量是否具有相关性的时候,比如新生录取率与性别,报酬与性别等,会分别对之进行分组研究。辛普森悖论是在这种研究中,在某些前提下有时会产生的一种现象。即在分组比较中都占优势的一方,会 阅读全文
posted @ 2018-08-12 18:25 强迫疒 阅读(1336) 评论(0) 推荐(0) 编辑
摘要: 平均来说,一个人的朋友数量往往比他朋友的朋友数量要少。 举个简单的例子:下图中连线的人彼此是朋友,A,B,C,D分别有1,3,2,2个朋友,平均有2个朋友,而我们再看每个人朋友的朋友。A的朋友有3个朋友(来自B),B的朋友分别有1个(A),2个(C),2个(D)朋友,C的朋友分别有3个(B),2个( 阅读全文
posted @ 2018-08-12 18:25 强迫疒 阅读(1655) 评论(0) 推荐(0) 编辑
摘要: 1. 爬取验证码图片 2. 二值化 接下来要做的工作就是二值化验证码,所谓二值化,就是将每一个像素点用0或1来表示,图像的每个像素点都有rgb三个值,我们首先转化成灰度图,这样每个像素点就只有一个灰度值了。接下来根据自己设定的阈值来确定每个像素点是该为0还是为1。 我的思路是首先将图像转化为arra 阅读全文
posted @ 2018-08-08 20:06 强迫疒 阅读(663) 评论(0) 推荐(0) 编辑
摘要: 一、SVM SVM的英文全称是Support Vector Machines,我们叫它支持向量机。支持向量机是我们用于分类的一种算法。 1 示例: 先用一个例子,来了解一下SVM 桌子上放了两种颜色的球,用一根棍分开它们,要求:尽量在放更多球之后,仍然适用。 我们可以这样放: 又在桌上放了更多的球, 阅读全文
posted @ 2018-07-25 22:45 强迫疒 阅读(514) 评论(0) 推荐(0) 编辑
摘要: 一、示例 给定下列训练样本,用AdaBoost算法学习一个强分类器。 求解过程:初始化训练数据的权值分布,令每个权值W1i = 1/N = 0.1,其中,N = 10,i = 1,2, ..., 10,然后分别对于m = 1,2,3, ...等值进行迭代。 1 迭代过程1 对于m=1,在权值分布为D 阅读全文
posted @ 2018-07-18 20:32 强迫疒 阅读(185) 评论(0) 推荐(0) 编辑
摘要: 一、Boosting算法 .Boosting算法是一种把若干个分类器整合为一个分类器的方法,在boosting算法产生之前,还出现过两种比较重要的将多个分类器整合为一个分类器的方法,即boostrapping方法和bagging方法。我们先简要介绍一下bootstrapping方法和bagging方 阅读全文
posted @ 2018-07-05 18:55 强迫疒 阅读(246) 评论(0) 推荐(0) 编辑
摘要: 一、决策树 决策树是什么?决策树(decision tree)是一种基本的分类与回归方法。举个通俗易懂的例子,如下图所示的流程图就是一个决策树,长方形代表判断模块(decision block),椭圆形成代表终止模块(terminating block),表示已经得出结论,可以终止运行。从判断模块引 阅读全文
posted @ 2018-07-04 19:39 强迫疒 阅读(263) 评论(0) 推荐(0) 编辑
摘要: 一、条件概率 在学习计算p1和p2概率之前,我们需要了解什么是条件概率,就是指在事件B发生的情况下,事件A发生的概率,用P(A|B)来表示。 根据文氏图,可以很清楚地看到在事件B发生的情况下,事件A发生的概率就是P(A∩B)除以P(B)。 这就是条件概率的计算公式。 二、贝叶斯推断 对条件概率公式进 阅读全文
posted @ 2018-07-04 19:39 强迫疒 阅读(406) 评论(0) 推荐(0) 编辑
摘要: 一、背景 海伦女士一直使用在线约会网站寻找适合自己的约会对象。尽管约会网站会推荐不同的任选,但她并不是喜欢每一个人。经过一番总结,她发现自己交往过的人可以进行如下分类 不喜欢的人 魅力一般的人 极具魅力的人 海伦收集约会数据已经有了一段时间,她把这些数据存放在文本文件datingTestSet.tx 阅读全文
posted @ 2018-06-21 00:46 强迫疒 阅读(337) 评论(0) 推荐(0) 编辑
摘要: 一、机器学习是什么 机器学习的英文名称叫Machine Learning,简称ML,该领域主要研究的是如何使计算机能够模拟人类的学习行为从而获得新的知识和技能,并且重新组织已学习到的知识和和技能,使之在应用中能够不断完善自身的缺陷与不足。 简单来说,机器学习就是让计算机从大量的数据中学习到相关的规律 阅读全文
posted @ 2018-06-20 20:25 强迫疒 阅读(183) 评论(0) 推荐(0) 编辑