上一页 1 ··· 30 31 32 33 34 35 36 37 38 ··· 48 下一页
摘要: tensorflow每个变量封装了一个程序,需要通过sess.run 进行调用 接下来我们使用一下使用mnist数据,这是一个手写图像的数据,训练集是55000*28*28, 测试集10000* 28*28 第一步:导入数据 第二步:初识化变量 第三步: 构造初始化函数 第四步:迭代优化参数 阅读全文
posted @ 2018-08-31 21:21 python我的最爱 阅读(228) 评论(0) 推荐(0) 编辑
摘要: TensorFlow™ 是一个开放源代码软件库,用于进行高性能数值计算。借助其灵活的架构,用户可以轻松地将计算工作部署到多种平台(CPU、GPU、TPU)和设备(桌面设备、服务器集群、移动设备、边缘设备等)。TensorFlow™ 最初是由 Google Brain 团队(隶属于 Google 的 阅读全文
posted @ 2018-08-31 11:17 python我的最爱 阅读(495) 评论(0) 推荐(0) 编辑
摘要: pca是一种黑箱子式的降维方式,通过映射,希望投影后的数据尽可能的分散, 因此要保证映射后的方差尽可能大,下一个映射的方向与当前映射方向正交 pca的步骤: 第一步: 首先要对当前数据(去均值)求协方差矩阵,协方差矩阵= 数据*数据的转置/(m-1) m表示的列数,对角线上表示的是方差,其他位置表示 阅读全文
posted @ 2018-08-24 22:16 python我的最爱 阅读(627) 评论(0) 推荐(0) 编辑
摘要: DBSCAN 是一种基于密度的分类方法 若一个点的密度达到算法设定的阖值则其为核心点(即R领域内点的数量不小于minPts) 所以对于DBSCAN需要设定的参数为两个半径和minPts 我们以一个啤酒的分类指标来做第一步:提取数据,并分配变量 第二步:构建模型,并做测试,我们使用的r半径为10,最小 阅读全文
posted @ 2018-08-24 17:09 python我的最爱 阅读(543) 评论(0) 推荐(0) 编辑
摘要: kmeans是一种无监督的聚类问题,在使用前一般要进行数据标准化, 一般都是使用欧式距离来进行区分,主要是通过迭代质心的位置 来进行分类,直到数据点不发生类别变化就停止, 一次分类别,一次变换质心,就这样不断的迭代下去 优势:使用方便劣势:1.K值难确定 2. 复杂度与样本数量呈线性关系 3.很难发 阅读全文
posted @ 2018-08-24 17:01 python我的最爱 阅读(889) 评论(0) 推荐(0) 编辑
摘要: 支持向量机是一个点离决策边界越近,离决策面越远的问题 求解的过程主要是通过拉格朗日乘子法,来求解带约束的优化问题,在问题中涉及两个方面,一个是线性的,一个是非线性的,非线性的有 我们平时比较常见的高斯核函数(径向基函数),他的主要做法就是把低维的数据变成高维数据,通过^2的方法 在支持向量基中的参数 阅读全文
posted @ 2018-08-23 20:30 python我的最爱 阅读(529) 评论(0) 推荐(0) 编辑
摘要: 我们使用了两种提取方式 1 .词频统计 2. 关键字提取 关键字提取的方式效果更好一些 第一步:数据读取 第二步:数据预处理,把每一行的内容拆分成一个个词 第三步: 与停用词库进行比对,去除内容中的停用词 ‘ 第四步构建模型,这里的数据我们需要做一步‘ ’.join的重连接,对于分类标签需要转换为数 阅读全文
posted @ 2018-08-22 23:18 python我的最爱 阅读(361) 评论(0) 推荐(0) 编辑
摘要: p(h+|D) = p(h) * p(D|h+) / p(D) 表示一个单词输错的概率 = 单词的词频 * 一个输错单词的可能的正确单词的数量 p(h-|D) = p(h) * p(D|h-) / p(D) 第一步:读取词库,通过正则找出每个单词,并统计单词的词频 第二步 : 模拟一个错误单词的其他 阅读全文
posted @ 2018-08-22 15:29 python我的最爱 阅读(258) 评论(0) 推荐(0) 编辑
摘要: 虽然Logistic回归叫回归,但是其实它是一个二分类或者多分类问题 这里的话我们使用信用诈骗的数据进行分析 第一步:导入数据,Amount的数值较大,后续将进行(-1,1)的归一化 第二步: 对正常和欺诈的数目进行查看,正常样本的数目远大于欺诈样本,这个时候可以使用下采样或者过采样 第三步:将am 阅读全文
posted @ 2018-08-22 11:03 python我的最爱 阅读(302) 评论(0) 推荐(0) 编辑
摘要: 我们以泰坦尼克号的获救信息为列 第一步:读取数据 第二步:数据准备 1.对于数字型缺失,我们使用均值来填充缺失值,对于字母型缺失, 我们使用出现概率最大的字母来填充缺失值 2.为了便于计算我们需要把字母类型,转换为数字类型 第三步:算法尝试,我们使用了线性回归 第四步: 使用logistic做尝试, 阅读全文
posted @ 2018-08-21 23:02 python我的最爱 阅读(788) 评论(0) 推荐(0) 编辑
上一页 1 ··· 30 31 32 33 34 35 36 37 38 ··· 48 下一页