摘要: 5.2.4 训练算法:随机梯度上升 梯度上升算法:在每次更新回归系数时都需要遍历整个数据集,在数十亿样本上该算法复杂度太高。 改进方法:随机梯度上升算法:一次仅用一个样本点更新回归系数。 由于可以在新样本到来时对分类器进行增量式更新,因此随机梯度上升算法是一个在线学习算法。与“在线学习”相对应,一次 阅读全文
posted @ 2016-02-17 23:07 hudongni1 阅读(1304) 评论(0) 推荐(0) 编辑
摘要: 首次接触最优化算法。介绍几个最优化算法,并利用它们训练出一个非线性函数用于分类。 假设现在有一些数据点,我们利用一条直线对这些点进行拟合(该直线为最佳拟合直线),这个拟合过程称作回归。 利用Logistic回归进行分类思想:根据现有数据对分类边界线建立回归公式,以此进行分类。 这里的“回归”一词源于 阅读全文
posted @ 2016-02-05 15:23 hudongni1 阅读(987) 评论(0) 推荐(0) 编辑
摘要: 4.7 示例:使用朴素贝叶斯分类器从个人广告中获取区域倾向 前面介绍了两个应用:1.过滤网站的恶意留言;2.过滤垃圾邮件。 4.7.1 收集数据:导入RSS源 Universal Feed Parser是Python中最常用的RSS程序库。 在Python提示符下输入: 构建类似于spamTest( 阅读全文
posted @ 2016-01-31 22:29 hudongni1 阅读(343) 评论(0) 推荐(0) 编辑
摘要: 4.6 示例:使用朴素贝叶斯过滤垃圾邮件 使用朴素贝叶斯解决一些现实生活中的问题时,需要从文本内容-->字符串列表-->词向量。 下面,将了解朴素贝叶斯一个最著名的应用:电子邮件垃圾过滤。 4.6.1 准备数据:切分文本 对于一个文本字符串,可以使用Python的string.split()方法切分 阅读全文
posted @ 2016-01-30 17:53 hudongni1 阅读(598) 评论(0) 推荐(0) 编辑
摘要: 4.5 使用Python进行文本分类 4.5.1 准备数据:从文本中构建词向量 4.5.2 训练算法:从词向量计算概率 4.5.3 测试算法:根据显示情况修改分类器 拉普拉斯平滑 条件概率p(w0|1)p(w1|1)p(w2|1),如果一个为0,最后乘机也为0.为降低这种影响,可以将所有词出现数初始 阅读全文
posted @ 2016-01-18 22:25 hudongni1 阅读(412) 评论(0) 推荐(0) 编辑
摘要: 在MAC操作系统下,生成Apple证书比较简单,全图形化操作。一、使用Keychain Access(钥匙串访问)MAC操作系统对证书的处理都采用了“Keychain Access”(中文系统名为“钥匙串访问”)。使用Keychain Access的方式是,在Finder - Utilities -... 阅读全文
posted @ 2016-01-13 15:46 hudongni1 阅读(2191) 评论(0) 推荐(0) 编辑
摘要: 3.1 决策树的构造 3.1.1 信息增益 熵(entropy)是信息的期望值。如果待分类的事物可能划分在多个分类中,则符号xi的信息定义为:,p(xi)为该分类的概率。 为了计算熵,需计算所有类别所有可能包含的信息期望值:,n是分类的数目。 3.1.2 划分数据集 分类算法需要:上述的测量信息熵、 阅读全文
posted @ 2015-12-06 21:21 hudongni1 阅读(134) 评论(0) 推荐(0) 编辑
摘要: 2.3 示例:手写识别系统 2.3 .1 准备数据:将图像转换为测试向量 训练样本:trainingDigits 2000个例子,每个数字大约200个样本 测试数据:testDigits 大约900个 为使用前面两个例子的分类器,我们需要先把图像格式转换为一个向量。将32x32二进制图像矩阵转换为1 阅读全文
posted @ 2015-11-25 15:16 hudongni1 阅读(228) 评论(0) 推荐(0) 编辑
摘要: 给定训练数据样本和标签,对于某测试的一个样本数据,选择距离其最近的k个训练样本,这k个训练样本中所属类别最多的类即为该测试样本的预测标签。简称kNN。通常k是不大于20的整数,这里的距离一般是欧式距离。 2:python代码 2.1 kNN概述 2.1.1:准备:使用python导入数据 2.2.1 阅读全文
posted @ 2015-11-24 16:07 hudongni1 阅读(497) 评论(0) 推荐(0) 编辑
摘要: 一:PICT安装1.下载pict33.msi:http://vdisk.weibo.com/s/d6k2tcgXDa7Eq2.安装:二:PICT的使用1.在F:\PICT 目录下,新建一个txt文本,并将参数填入其中:(txt文件名最好是英文名,文本标点必须是英文标点)2.打开cmd,进入命令提示符... 阅读全文
posted @ 2015-05-30 13:58 hudongni1 阅读(182) 评论(0) 推荐(0) 编辑