上一页 1 ··· 3 4 5 6 7 8 9 10 下一页
摘要: 考虑一个多分类问题,即预测变量y可以取k个离散值中的任何一个.比如一个邮件分类系统将邮件分为私人邮件,工作邮件和垃圾邮件。由于y仍然是一个离散值,只是相对于二分类的逻辑回归多了一些类别。下面将根据多项式分布建模。考虑将样本共有k类,每一类的概率分别为,由于,所以通常我们只需要k-1个参数即可,为了推... 阅读全文
posted @ 2014-10-07 15:41 90Zeng 阅读(2824) 评论(0) 推荐(0) 编辑
摘要: 开始,首先下载数据ex4Data.zip假设该数据集代表着一所高中学生中40名被大学录取,而另外40名没有被大学录取。每一个训练样例(x(i),y(i))包含一个学生的两科标准考试成绩以及是否被录取的标签。现在需要建立一个分类模型,要求根据学生的两科考试成绩,来判断学生被录取的概率。画出数据:x =... 阅读全文
posted @ 2014-10-07 11:52 90Zeng 阅读(1306) 评论(0) 推荐(0) 编辑
摘要: 在逻辑回归之问题建模分析中我们提到最大化参数θ的最大化似然函数可以用梯度下降法,对参数进行更新直至上面的对数似然函数收敛。下面引入另一种方法:牛顿方法。开始,首先我们考虑如何找到一个函数的零点。也就是我们有一个函数:,我们希望找到一个值θ,使得.我们首先随机取某一点(x,f(x)),那么f(x)在该... 阅读全文
posted @ 2014-10-07 10:34 90Zeng 阅读(909) 评论(0) 推荐(0) 编辑
摘要: 首先,我们引入分类问题,其实分类问题和回归问题很相似,只是分类问题中我们要预测的y值是有限数量的离散值,而不是回归问题中的连续值。为了说明,我们现在只讨论二分类问题,也就是说y只能取0和1两种值。对于这种二分类问题,当然也可以用线性回归去学习,然后根据给的的x预测出y,只是当预测出的y大于1或者小于... 阅读全文
posted @ 2014-10-06 22:40 90Zeng 阅读(1159) 评论(1) 推荐(0) 编辑
摘要: 考虑下图所示数据集:这是一个关于居住面积,卧室数量和房屋价格的数据集。对于这个数据集,x就是二维的向量,因为每一个训练样本包含两个属性(居住面积,卧室数量)。为了进行监督学习,必须提出一个合理的假设或函数,假如我们用线性函数$h_{\theta}(x)=\theta_{0}+\theta_{1}x_... 阅读全文
posted @ 2014-10-06 20:31 90Zeng 阅读(932) 评论(0) 推荐(0) 编辑
摘要: 对于数据ex2Data.zip,学习出一个函数h(x),使之能较好地预测出y的值。其中x表示孩子的年龄,y表示孩子的身高。首先画出原始数据在坐标轴中的分布情况:x = load('ex2x.dat'); y = load('ex2y.dat');m = length(y); %计算出训练样本的个数%... 阅读全文
posted @ 2014-10-06 12:07 90Zeng 阅读(940) 评论(2) 推荐(1) 编辑
摘要: 假设有以下面积和房屋价格的数据集:可以在坐标中画出数据的情况:就是基于这样一个数据集,假定给出一个房屋的面积,如何预测出它的价格?很显然就是我们只需建立一个关于房屋面积的函数,输出就是房屋的价格。所以引出监督学习的概念:给定训练集X,学习出一个函数h:X→Y,使得函数h(x)能够较好地对于Y做出预测... 阅读全文
posted @ 2014-10-06 10:31 90Zeng 阅读(439) 评论(0) 推荐(0) 编辑
摘要: 利用hadoop实现一个简单的倒排索引。 阅读全文
posted @ 2014-08-25 11:23 90Zeng 阅读(505) 评论(0) 推荐(0) 编辑
摘要: 最简洁地介绍==运算符与equals方法的异同。 阅读全文
posted @ 2014-08-22 19:01 90Zeng 阅读(780) 评论(1) 推荐(0) 编辑
摘要: 用最简单的图文介绍Java中的引用的原理。 阅读全文
posted @ 2014-08-21 10:46 90Zeng 阅读(1247) 评论(3) 推荐(1) 编辑
上一页 1 ··· 3 4 5 6 7 8 9 10 下一页