摘要: 1、数据类型 数据分析中主要有两类变量: 分类变量:分类变量取值一个集合,每一个值表示变量的一个分类,分类变量可以分为顺序变量和名称变量 顺序变量可以按照一定顺序排列起来,如:评价体检结果:不良<一般<良好 名称变量不存在顺序关系,如:性别男或者女 数值变量:本身是数值型,其次可以进行数值操作,如: 阅读全文
posted @ 2019-03-10 13:49 起航追梦人 阅读(1593) 评论(0) 推荐(0) 编辑
摘要: step_1:目标确定 通过问卷调查数据,选取其中多组变量来预测其对幸福感的评价。 step_2:数据获取 连接: https://tianchi.aliyun.com/competition/entrance/231702/information 下载: train_set:happiness_t 阅读全文
posted @ 2019-03-07 00:47 起航追梦人 阅读(3679) 评论(0) 推荐(1) 编辑
摘要: 1、梯度下降的概念 https://1drv.ms/u/s!AlpiCfg9Lzmug1Dj69iU4OC0Rpt- 2、梯度下降的类型 批量梯度下降 随机梯度下降 小批量梯度下降 3、sklearn实现梯度下降 # 随机梯度下降 from sklearn.linear_model import S 阅读全文
posted @ 2019-03-01 21:25 起航追梦人 阅读(2593) 评论(0) 推荐(0) 编辑
摘要: 1、简单线性回归概念 简单线性回归通过拟合线性方程y=wx+b得到预测值,通过取得预测值和真实值的最小差距,得到w和b的值。 公式:J(w,b)min=Σ(yi-yipre)2=∑(yi-wxi+b)2,即公式取最小值 2、通过最小二乘法求解w和b w = ∑(xi-xmean)(yi-ymean) 阅读全文
posted @ 2019-03-01 21:21 起航追梦人 阅读(1397) 评论(0) 推荐(0) 编辑
摘要: 一、K邻近算法的基本概念 一个样本在特征空间中最邻近(距离)的K个样本大多数属于某一个类别,则该样本也属于这个类别。 二、sklearn使用欧氏距离实现KNN算法 # 倒入sklearn库中的KNN算法类 from sklearn.neighbors import KNeighborsClassif 阅读全文
posted @ 2019-02-25 14:37 起航追梦人 阅读(466) 评论(0) 推荐(0) 编辑
摘要: 一、准备工作 1、MNIST概念 是一个识别手写数字图片的计算机视觉集,它包含各种手写数字图片和每张图片对应的标签 2、softmax回归 softmax回归是logistic回归的一种,它是多元分类(包含二分类)。 sotfmax回归可以把多分类任务多输出转换为各种类别的可能概率,把最大概率值对应 阅读全文
posted @ 2019-02-19 14:27 起航追梦人 阅读(1382) 评论(0) 推荐(0) 编辑
摘要: 1、MacOS Tensorflow(CPU版本)下载和安装 2、Tensorflow的基本用法 使用图(graph)来表示计算任务 在回话(Session)的上下文(context)中执行图 使用tensor表示数据 通过变量(Variable)维护状态 使用feed和fetch可以为任意的操作赋 阅读全文
posted @ 2019-02-18 22:48 起航追梦人 阅读(3111) 评论(0) 推荐(0) 编辑
摘要: 本文是摘抄学习大神 计算机的潜意识 文章 https://www.cnblogs.com/subconscious/p/5058741.html 神经网络是一种模拟人脑的神经网络,期望能够实现类人的人工智能机器学习技术。 一、经典神经网络模型 这个模型包含三个层次的神经网络,红色是输入层(3个输入单 阅读全文
posted @ 2018-12-28 22:31 起航追梦人 阅读(790) 评论(0) 推荐(0) 编辑
摘要: 过拟合问题 什么是欠拟合? 欠拟合就是拟合度不好,存在高度偏差 什么是过拟合? 过拟合就是在训练数据上能够高度拟合,在应用数据集上却不能很好的拟合。 出现这种现象的主要原因是训练数据种特征变量太多存在噪音或者训练数据太少。 怎么解决过拟合问题? 1、减少特征变量的数量 2、正则化:保留所有的特征变量 阅读全文
posted @ 2018-12-28 16:33 起航追梦人 阅读(137) 评论(0) 推荐(0) 编辑
摘要: logistic回归是使用最多的分类算法 二分类 预测值:yε{0, 1}, 0代表负类(No, 假设不成立);1代表正类(Yes,假设成立) 应用:邮件分类(垃圾邮件 or 非垃圾邮件) 假设函数 logistic函数又称Sigmoid函数,是一个在生物学中常见的S型函数,也称为S型生长曲线。由于 阅读全文
posted @ 2018-12-27 23:40 起航追梦人 阅读(458) 评论(0) 推荐(0) 编辑