04 2015 档案

摘要:- [前言](#1)- [训练样本准备](#2)- [特征选择](#3)- [模型选择](#4)- [交叉验证](#5)- [结语](#6) ##前言--- 学习理论是一系列的理论与方法,用于保证训练出的模型能高效稳定工作。机器学习算法主要有4个阶段:1. **训练样本准备**。充分有效的训... 阅读全文
posted @ 2015-04-29 20:23 过客冲冲 阅读(1204) 评论(0) 推荐(0) 编辑
摘要:当初由于一些原因以及兴趣,学习了一段时间软件逆向,对于软件加密解密有了点粗略的了解。而后看到某些同学辛辛苦苦的搞出个软件,自己费心费力去加密,但搞出来后往往能被秒破,实不忍心。今天大概总结下一些基本的软件加密手段,以供参考,高手勿喷。关于解密 软件解密主要有2个层次,一个俗称爆破,就是不分析加... 阅读全文
posted @ 2015-04-22 19:23 过客冲冲 阅读(1965) 评论(18) 推荐(8) 编辑
摘要:朴素贝叶斯(Naive Bayes)适用于离散特征的分类问题,对于连续问题则需将特征离散化后使用。朴素贝叶斯有多元伯努利事件模型和多项式事件模型,在伯努利事件模型中,特征每一维的值只能是0或1,而多项式模型中特征每一维的值可取0到N之间的整数,因此伯努利模型是多项式模型的一种特例,下面的推导就直... 阅读全文
posted @ 2015-04-21 15:58 过客冲冲 阅读(2149) 评论(0) 推荐(0) 编辑
摘要:梯度下降法存在的问题 梯度下降法的基本思想是函数沿着其梯度方向增加最快,反之,沿着其梯度反方向减小最快。在前面的线性回归和逻辑回归中,都采用了梯度下降法来求解。梯度下降的迭代公式为:\(\begin{aligned} \theta_j=\theta_j-\alpha\frac{\partial\;... 阅读全文
posted @ 2015-04-20 15:54 过客冲冲 阅读(3538) 评论(3) 推荐(2) 编辑
摘要:高斯判别分析(GDA)简介 首先,高斯判别分析的作用也是用于分类。对于两类样本,其服从伯努利分布,而对每个类中的样本,假定都服从高斯分布,则有: yBernouli(ϕ) x|y=0N(μ0,Σ) \( x|y=1\;\ 阅读全文
posted @ 2015-04-14 17:07 过客冲冲 阅读(11803) 评论(16) 推荐(8) 编辑
摘要:指数分布族 首先需要提及下指数分布族,它是指一系列的分布,只要其概率密度函数可以写成下面这样的形式:p(y;η)=b(y)exp(ηTT(y)a(η)) 一般的很多分布(如高斯分布,泊松分布,二项式分布,伽马... 阅读全文
posted @ 2015-04-13 16:36 过客冲冲 阅读(1212) 评论(0) 推荐(0) 编辑
摘要:前一节讲线性回归已提过,回归问题的根本目的在于预测。直观上看,线性回归训练与预测的值域都为实数域R,而逻辑回归训练样本值域为{0,1},预测的值域则是(0,1),也就是说逻辑回归用于分类,其结果能给出样本属于某个类的概率。逻辑回归逻辑回归作为机器学习中的一个简单而有效的算法,其应用之广泛已超出我... 阅读全文
posted @ 2015-04-10 15:01 过客冲冲 阅读(2606) 评论(0) 推荐(1) 编辑
摘要:自去年底开始学习Andrew Ng的机器学习公开课,欲依其课件试着实现部分算法以加深理解,然在此过程中遇到部分问题,或为程序实现,或为算法理解。故而准备将此课程整理,并记录自己的理解,或对或错可共同讨论。 此课程主要包括三部分:监督学习算法、无监督学习算法以及学习理论。监督学习部分讲了回归、生... 阅读全文
posted @ 2015-04-08 10:34 过客冲冲 阅读(763) 评论(0) 推荐(0) 编辑
摘要:回归问题提出 首先需要明确回归问题的根本目的在于预测。对于某个问题,一般我们不可能测量出每一种情况(工作量太大),故多是测量一组数据,基于此数据去预测其他未测量数据。 比如课程给出的房屋面积、房间数与价格的对应关系,如下表: 若要测量出所有情况,不知得测到猴年马月了。有了上面这一组测量数据,我... 阅读全文
posted @ 2015-04-08 10:31 过客冲冲 阅读(2252) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示