python我的最爱

2018年8月31日

摘要： tensorflow每个变量封装了一个程序，需要通过sess.run 进行调用接下来我们使用一下使用mnist数据，这是一个手写图像的数据，训练集是55000*28*28, 测试集10000* 28*28 第一步：导入数据第二步：初识化变量第三步：构造初始化函数第四步：迭代优化参数阅读全文

posted @ 2018-08-31 21:21 python我的最爱阅读(248) 评论(0) 推荐(0)

跟我学算法-tensorflow 实现线性拟合

摘要： TensorFlow™ 是一个开放源代码软件库，用于进行高性能数值计算。借助其灵活的架构，用户可以轻松地将计算工作部署到多种平台（CPU、GPU、TPU）和设备（桌面设备、服务器集群、移动设备、边缘设备等）。TensorFlow™ 最初是由 Google Brain 团队（隶属于 Google 的阅读全文

posted @ 2018-08-31 11:17 python我的最爱阅读(528) 评论(0) 推荐(0)

2018年8月24日

跟我学算法-pca(降维)

摘要： pca是一种黑箱子式的降维方式，通过映射，希望投影后的数据尽可能的分散，因此要保证映射后的方差尽可能大，下一个映射的方向与当前映射方向正交 pca的步骤：第一步: 首先要对当前数据(去均值)求协方差矩阵，协方差矩阵= 数据*数据的转置/(m-1) m表示的列数，对角线上表示的是方差，其他位置表示阅读全文

posted @ 2018-08-24 22:16 python我的最爱阅读(670) 评论(0) 推荐(0)

跟我学算法聚类(DBSCAN)

摘要： DBSCAN 是一种基于密度的分类方法若一个点的密度达到算法设定的阖值则其为核心点（即R领域内点的数量不小于minPts）所以对于DBSCAN需要设定的参数为两个半径和minPts 我们以一个啤酒的分类指标来做第一步：提取数据，并分配变量第二步：构建模型,并做测试，我们使用的r半径为10，最小阅读全文

posted @ 2018-08-24 17:09 python我的最爱阅读(601) 评论(0) 推荐(0)

跟我学算法聚类(kmeans)

摘要： kmeans是一种无监督的聚类问题，在使用前一般要进行数据标准化, 一般都是使用欧式距离来进行区分，主要是通过迭代质心的位置来进行分类，直到数据点不发生类别变化就停止, 一次分类别，一次变换质心，就这样不断的迭代下去优势：使用方便劣势：1.K值难确定 2. 复杂度与样本数量呈线性关系 3.很难发阅读全文

posted @ 2018-08-24 17:01 python我的最爱阅读(933) 评论(0) 推荐(0)

2018年8月23日

跟我学算法-SVM(支持向量机)

摘要：支持向量机是一个点离决策边界越近，离决策面越远的问题求解的过程主要是通过拉格朗日乘子法，来求解带约束的优化问题，在问题中涉及两个方面，一个是线性的，一个是非线性的，非线性的有我们平时比较常见的高斯核函数(径向基函数),他的主要做法就是把低维的数据变成高维数据，通过^2的方法在支持向量基中的参数阅读全文

posted @ 2018-08-23 20:30 python我的最爱阅读(547) 评论(0) 推荐(0)

2018年8月22日

跟我学算法-贝叶斯文本分类器

摘要：我们使用了两种提取方式 1 .词频统计 2. 关键字提取关键字提取的方式效果更好一些第一步：数据读取第二步：数据预处理，把每一行的内容拆分成一个个词第三步：与停用词库进行比对，去除内容中的停用词 ‘ 第四步构建模型，这里的数据我们需要做一步‘ ’.join的重连接,对于分类标签需要转换为数阅读全文

posted @ 2018-08-22 23:18 python我的最爱阅读(384) 评论(0) 推荐(0)

跟我学算法-贝叶斯拼写检查器

摘要： p(h+|D) = p(h) * p(D|h+) / p(D) 表示一个单词输错的概率 = 单词的词频 * 一个输错单词的可能的正确单词的数量 p(h-|D) = p(h) * p(D|h-) / p(D) 第一步：读取词库，通过正则找出每个单词，并统计单词的词频第二步 : 模拟一个错误单词的其他阅读全文

posted @ 2018-08-22 15:29 python我的最爱阅读(290) 评论(0) 推荐(0)

跟我学算法-Logistic回归

摘要：虽然Logistic回归叫回归，但是其实它是一个二分类或者多分类问题这里的话我们使用信用诈骗的数据进行分析第一步：导入数据，Amount的数值较大，后续将进行(-1,1)的归一化第二步: 对正常和欺诈的数目进行查看，正常样本的数目远大于欺诈样本，这个时候可以使用下采样或者过采样第三步：将am 阅读全文

posted @ 2018-08-22 11:03 python我的最爱阅读(320) 评论(0) 推荐(0)

2018年8月21日

跟我学算法-集成算法

摘要：我们以泰坦尼克号的获救信息为列第一步：读取数据第二步：数据准备 1.对于数字型缺失,我们使用均值来填充缺失值,对于字母型缺失, 我们使用出现概率最大的字母来填充缺失值 2.为了便于计算我们需要把字母类型，转换为数字类型第三步:算法尝试，我们使用了线性回归第四步：使用logistic做尝试, 阅读全文

posted @ 2018-08-21 23:02 python我的最爱阅读(819) 评论(0) 推荐(0)