随笔 - 363, 文章 - 0, 评论 - 2, 阅读 - 23万
  博客园  :: 首页  :: 新随笔  :: 联系 :: 订阅 订阅  :: 管理
< 2025年2月 >
26 27 28 29 30 31 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 1
2 3 4 5 6 7 8

随笔分类 -  机器学习

摘要:基本概念 1. 与简单线性回归区别(simple linear regression) 多个自变量(x) 2. 多元回归模型 y=β0+β1x1+β2x2+ ... +βpxp+ε 其中:β0,β1,β2... βp是参数 ε是误差值 3. 多元回归方程 E(y)=β0+β1x1+β2x2+ ... 阅读全文

posted @ 2019-04-29 09:13 心默默言 阅读(2061) 评论(0) 推荐(0) 编辑

摘要:基本概念 1. 介绍: 回归(regression) Y变量为连续数值型(continuous numerical variable) 如:房价,人数,降雨量 分类(Classification): Y变量为类别型(categorical variable) 如:颜色类别,电脑品牌,有无信誉 2. 阅读全文

posted @ 2019-04-28 12:59 心默默言 阅读(659) 评论(0) 推荐(0) 编辑

摘要:一、基本概念 1. 背景 1.1 以人脑中的神经网络为启发,历史上出现过很多不同版本 1.2 最著名的算法是1980年的 backpropagation 2. 多层向前神经网络(Multilayer Feed-Forward Neural Network) 2.1 Backpropagation被使 阅读全文

posted @ 2019-04-26 19:49 心默默言 阅读(612) 评论(0) 推荐(0) 编辑

摘要:1.CART生成 CART假设决策树是二叉树,内部结点特征的取值为“是”和“否”,左分支是取值为“是”的分支,右分支是取值为“否”的分支。这样的决策树等价于递归地二分每个特征,将输入空间即特征空间划分为有限个单元,并在这些单元上确定预测的概率分布,也就是在输入给定的条件下输出的条件概率分布。 CAR 阅读全文

posted @ 2019-04-25 15:17 心默默言 阅读(659) 评论(0) 推荐(0) 编辑

摘要:集成算法 1.集成学习的概念 集成学习(ensemble learning)从概念上讲,它并不是一个单独的机器学习算法,而是通过构建并结合多个机器学习器来完成学习任务。也就是我们常说的“博采众长”。集成学习可以用于分类问题集成,回归问题集成,特征选取集成,异常点检测集成等等,可以说所有的机器学习领域 阅读全文

posted @ 2019-04-22 11:14 心默默言 阅读(251) 评论(0) 推荐(0) 编辑

摘要:https://blog.csdn.net/songyu0120/article/details/85059149 阅读全文

posted @ 2019-04-17 16:59 心默默言 阅读(1219) 评论(0) 推荐(0) 编辑

摘要:K-Means原理初探 K-Means算法的思想很简单,对于给定的样本集,按照样本之间的距离大小,将样本集划分为K个簇。让簇内的点尽量紧密的连在一起,而让簇间的距离尽量的大。 如果我们想直接求上式的最小值并不容易,这是一个NP难的问题,因此只能采用启发式的迭代方法。 K-Means采用的启发式方式很 阅读全文

posted @ 2019-04-14 19:23 心默默言 阅读(212) 评论(0) 推荐(0) 编辑

摘要:PCA——主成分分析 简介 PCA全称Principal Component Analysis,即主成分分析,是一种常用的数据降维方法。它可以通过线性变换将原始数据变换为一组各维度线性无关的表示,以此来提取数据的主要线性分量。 z=wTx 其中,z为低维矩阵,x为高维矩阵,w为两者之间的映射关系。假 阅读全文

posted @ 2019-04-09 20:47 心默默言 阅读(713) 评论(0) 推荐(0) 编辑

摘要:降维技术 对数据进行降维有如下一系列的原因: 在以下3种降维技术中, PCA的应用目前最为广泛,因此本章主要关注PCA。 主成分分析(Principal Component Analysis, PCA) 通俗理解:就是找出一个最主要的特征,然后进行分析。 在PCA中,数据集从原始坐标系转换为新的坐标 阅读全文

posted @ 2019-04-08 11:28 心默默言 阅读(320) 评论(0) 推荐(0) 编辑

摘要:https://blog.csdn.net/weixin_40123108/article/details/84378202 In [5]: from time import time import logging #程序进展信息 import matplotlib.pyplot as plt fr 阅读全文

posted @ 2019-04-07 10:04 心默默言 阅读(460) 评论(0) 推荐(0) 编辑

摘要:对偶的概念 https://blog.csdn.net/qq_34531825/article/details/52872819?locationNum=7&fps=1 拉格朗日乘子法、KKT条件 https://blog.csdn.net/mr_kktian/article/details/537 阅读全文

posted @ 2019-03-12 16:58 心默默言 阅读(306) 评论(0) 推荐(0) 编辑

摘要:https://blog.csdn.net/zengxiantao1994/article/details/72787849似然函数 原理:极大似然估计是建立在极大似然原理的基础上的一个统计方法,是概率论在统计学中的应用。极大似然估计提供了一种给定观察数据来评估模型参数的方法,即:“模型已定,参数未 阅读全文

posted @ 2019-03-10 20:30 心默默言 阅读(226) 评论(0) 推荐(0) 编辑

摘要:Logistic 回归 概述 Logistic 回归 或者叫逻辑回归 虽然名字有回归,但是它是用来做分类的。其主要思想是: 根据现有数据对分类边界线(Decision Boundary)建立回归公式,以此进行分类。 须知概念 Sigmoid 函数 回归 概念 假设现在有一些数据点,我们用一条直线对这 阅读全文

posted @ 2019-03-09 20:05 心默默言 阅读(312) 评论(0) 推荐(0) 编辑

摘要:In [8]: import numpy as np import matplotlib.pyplot as plt import matplotlib as mpl from sklearn.preprocessing import StandardScaler from sklearn.naiv 阅读全文

posted @ 2019-03-08 17:00 心默默言 编辑

摘要:朴素贝叶斯 概述 贝叶斯分类是一类分类算法的总称,这类算法均以贝叶斯定理为基础,故统称为贝叶斯分类。本章首先介绍贝叶斯分类算法的基础——贝叶斯定理。最后,我们通过实例来讨论贝叶斯分类的中最简单的一种: 朴素贝叶斯分类。 贝叶斯理论 & 条件概率 贝叶斯理论 我们现在有一个数据集,它由两类数据组成,数 阅读全文

posted @ 2019-03-08 10:51 心默默言 阅读(297) 评论(0) 推荐(0) 编辑

摘要:sklearn.tree.DecisionTreeClassifier 基于 scikit-learn 的决策树分类模型 DecisionTreeClassifier 进行的分类运算 http://scikit-learn.org/stable/modules/generated/sklearn.t 阅读全文

posted @ 2019-03-07 19:00 心默默言 阅读(254) 评论(0) 推荐(0) 编辑

摘要:决策树 概述 决策树(Decision Tree)算法是一种基本的分类与回归方法,是最经常使用的数据挖掘算法之一。我们这章节只讨论用于分类的决策树。 决策树模型呈树形结构,在分类问题中,表示基于特征对实例进行分类的过程。它可以认为是 if-then 规则的集合,也可以认为是定义在特征空间与类空间上的 阅读全文

posted @ 2019-03-07 18:14 心默默言 阅读(277) 评论(0) 推荐(0) 编辑

摘要:第2章 k-近邻算法 KNN 概述 k-近邻(kNN, k-NearestNeighbor)算法是一种基本分类与回归方法,我们这里只讨论分类问题中的 k-近邻算法。 一句话总结:近朱者赤近墨者黑! k 近邻算法的输入为实例的特征向量,对应于特征空间的点;输出为实例的类别,可以取多类。k 近邻算法假设 阅读全文

posted @ 2019-02-20 11:15 心默默言 阅读(290) 评论(0) 推荐(0) 编辑

摘要:第1章 机器学习基础 机器学习 概述 机器学习(Machine Learning,ML) 是使用计算机来彰显数据背后的真实含义,它为了把无序的数据转换成有用的信息。是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新 阅读全文

posted @ 2019-02-18 19:07 心默默言 阅读(362) 评论(0) 推荐(0) 编辑

摘要:注意:此时的w和b和一开始的w和b已经不是一个东西了,他们之间相差了一个系数。wd=w,bd=b 阅读全文

posted @ 2018-12-29 14:23 心默默言 编辑

点击右上角即可分享
微信分享提示