摘要: 一、预备知识介绍 为什么需要统计量? 统计量:描述数据特征 1. 集中趋势衡量 1.1 均值(平均数,平均值)(mean) 1.2 中位数(median):将数据中的各个数值按照大小顺序排列,居于中间位置的变量。 当n为奇数时,直接取位置处于中间的变量 当n为偶数时,取中间两个量的平均值 1.3 众 阅读全文
posted @ 2019-02-28 18:17 大数据和AI玩出的梗 阅读(735) 评论(0) 推荐(0) 编辑
摘要: 1. 简单非线性关系数据集测试(XOR): X: Y 0 0 0 0 1 1 1 0 1 1 1 0 # -*- coding:utf-8 -*- from NeuralNetwork import NeuralNetwork import numpy as np nn = NeuralNetwor 阅读全文
posted @ 2019-02-26 22:00 大数据和AI玩出的梗 阅读(295) 评论(0) 推荐(0) 编辑
摘要: 1. 关于非线性转化方程(non-linear transformation function) sigmoid函数(S 曲线)用来作为activation function: sigmoid函数是一个在生物学中常见的S型函数,也称为S型生长曲线。 在信息科学中,由于其单增以及反函数单增等性质,si 阅读全文
posted @ 2019-02-26 21:34 大数据和AI玩出的梗 阅读(575) 评论(0) 推荐(0) 编辑
摘要: 1. SVM算法特性 1.1 训练好的模型的算法复杂度是由支持向量的个数决定的,而不是由数据的维度决定的。所以SVM不太容易产生overfitting 1.2 SVM训练出来的模型完全依赖于支持向量(Support Vectors), 即使训练集里面所有非支持向量的点都被去除,重复训练过程,结果仍然 阅读全文
posted @ 2019-02-24 19:36 大数据和AI玩出的梗 阅读(779) 评论(0) 推荐(0) 编辑
摘要: 1. 背景: 1.1 以人脑中的神经网络为启发,历史上出现过很多不同版本 1.2 最著名的算法是1980年的 backpropagation 2. 多层向前神经网络(Multilayer Feed-Forward Neural Network) 2.1 Backpropagation被使用在多层向前 阅读全文
posted @ 2019-02-24 18:58 大数据和AI玩出的梗 阅读(2750) 评论(0) 推荐(0) 编辑
摘要: 1. 背景: 1.1 最早是由 Vladimir N. Vapnik 和 Alexey Ya. Chervonenkis 在1963年提出 1.2 目前的版本(soft margin)是由Corinna Cortes 和 Vapnik在1993年提出,并在1995年发表 1.3 深度学习(2012) 阅读全文
posted @ 2019-02-23 20:57 大数据和AI玩出的梗 阅读(382) 评论(0) 推荐(0) 编辑
摘要: 最邻近规则分类(K-Nearest Neighbor)KNN算法 1.综述 1.1 Cover和Hart在1968年提出了最初的邻近算法 1.2 分类(classification)算法 1.3 输入基于实例的学习(instance-based learning),懒惰学习(lazy learing 阅读全文
posted @ 2019-02-23 16:23 大数据和AI玩出的梗 阅读(711) 评论(0) 推荐(0) 编辑
摘要: 决策树在线文档:https://scikit-learn.org/stable/modules/tree.html 安装Graphviz : http://www.graphviz.org/ 1.下载 2.安装:双击 3.创建桌面快捷方式 安装目录\bin文件夹\:找到gvedit.exe文件右键 阅读全文
posted @ 2019-02-21 18:07 大数据和AI玩出的梗 阅读(423) 评论(0) 推荐(0) 编辑
摘要: 1.什么是决策树/判定树(decision tree) 决策树是一个类似于流程图的树结构,其中每个内部结点表示在一个属性上的测试,每个分支代表一个属性输出,而每个树叶结点代表类或者类分布。树的最顶层是根结点。 机器学习中分类方法中的一个重要算法 2.构造决策树的基本算法 树叶 2.1 熵(entro 阅读全文
posted @ 2019-02-19 18:16 大数据和AI玩出的梗 阅读(1496) 评论(0) 推荐(0) 编辑
摘要: 一、基本概念:训练集、测试集、特征值、监督学习、非监督学习、半监督学习、分类、回归 1.概念学习:概念学习是指从有关某个布尔函数的输入输出训练样例中推断出该布尔函数 2.训练集(traning set/data)/训练样例(training examples):用来进行训练,也就是产生模型或者算法的 阅读全文
posted @ 2019-02-19 16:10 大数据和AI玩出的梗 阅读(370) 评论(0) 推荐(0) 编辑