Loading

摘要: Linear Classification 我们知道线性回归对数据要求有以下要求,数据未处理,需使用全部数据,数据满足线性关系。当我们对这个要求进行更改的时候,我们就会有新的模型来处理。 分类问题,回归模型是没有办法直接使用的。但是我们可以在线性模型的函数进行后再加入一层激活函数,这个函数是非线性的 阅读全文
posted @ 2022-01-17 13:52 Christopher·阳 阅读(414) 评论(0) 推荐(0) 编辑
摘要: # Linear Regression ## 定义 - 回归定义: 通过带标签样本训练构造适当模型并通过该模型算出新样本的预测值 - 线性回归: 基于线性模型的回归学习任务通常称之为线性回归,相应的线性模型称为线性回归模型 - 对于任意给定的样本$X= (x_1, x_2, … , x_𝑚)^𝑇 阅读全文
posted @ 2022-01-17 13:52 Christopher·阳 阅读(436) 评论(0) 推荐(0) 编辑
摘要: 个人认为正则化这个字眼有点太过抽象和宽泛,**其实正则化的本质很简单,就是对某一问题加以先验的限制或约束以达到某种特定目的的一种手段或操作。在算法中使用正则化的目的是防止模型出现过拟合。**一提到正则化,很多同学可能马上会想到常用的L1范数和L2范数,在汇总之前,我们先看下LP范数是什么鬼。 LP范 阅读全文
posted @ 2022-01-14 14:16 Christopher·阳 阅读(526) 评论(0) 推荐(0) 编辑
摘要: 衡量一个机器学习算法的好坏需要一个标准来衡量,对于不同场景中的不同任务就需要决定不同的指标来度量。根据没有免费午餐这个归纳偏好,我们可以知道,没有一种模型是完美适用于任何场景。所以选取一个合适的性能指标和选取一个切合的机器学习算法均是很重要的事情。所以本文对此加以整理 这里先对一些标记作出解释:给定 阅读全文
posted @ 2022-01-04 12:17 Christopher·阳 阅读(303) 评论(0) 推荐(0) 编辑
摘要: 机器学习定义 张志华教授定义为: A field that bridge computation and statistics with ties to information, signal process, algorithm control theory and optimization th 阅读全文
posted @ 2022-01-03 20:23 Christopher·阳 阅读(486) 评论(0) 推荐(1) 编辑
摘要: 机器学习中的监督学习本质上是给定一系列训练样本$(x_i,y_i)$,尝试学习$x \to y$的映射关系,使得给定一个$x$,即便这个$x$不在训练样本中,也能够得到尽量接近真实$y$的输出$\hat{y}$。而损失函数(Loss Function)则是这个过程中关键的一个组成部分,用来衡量模型的 阅读全文
posted @ 2021-12-24 11:36 Christopher·阳 阅读(238) 评论(0) 推荐(1) 编辑
摘要: 机器学习基础:线代 阅读全文
posted @ 2021-12-23 11:14 Christopher·阳 阅读(295) 评论(0) 推荐(0) 编辑
摘要: 机器学习 概率论相关应用部分,从大学课本中走出面向机器学习中概率的要求 阅读全文
posted @ 2021-12-23 11:08 Christopher·阳 阅读(591) 评论(0) 推荐(2) 编辑
摘要: 上图是MapReduce的任务处理过程 概述 MapReduce是一种分布式计算模型,由Google提出,主要用于搜索领域,解决海量数据的计算问题. MapReduce是分布式运行的,由两个阶段组成:Map和Reduce,Map阶段是一个独立的程序,有很多个节点同时运行,每个节点处理一部分数据。Re 阅读全文
posted @ 2021-12-22 21:31 Christopher·阳 阅读(66) 评论(0) 推荐(0) 编辑
摘要: 记录搭建hadoop的过程 阅读全文
posted @ 2021-12-22 21:19 Christopher·阳 阅读(59) 评论(0) 推荐(0) 编辑