摘要: 前面的文章已经介绍了一个回归和一个分类的例子。在逻辑回归模型中我们假设: 在分类问题中我们假设: 他们都是广义线性模型中的一个例子,在理解广义线性模型之前需要先理解指数分布族。 指数分布族(The Exponential Family) 如果一个分布可以用如下公式表达,那么这个分布就属于指数分布族: 阅读全文
posted @ 2016-07-11 21:55 鹰杰 阅读(590) 评论(0) 推荐(0) 编辑
摘要: 本文主要讲解分类问题中的逻辑回归。逻辑回归是一个二分类问题。 二分类问题 二分类问题是指预测的y值只有两个取值(0或1),二分类问题可以扩展到多分类问题。例如:我们要做一个垃圾邮件过滤系统,是邮件的特征,预测的y值就是邮件的类别,是垃圾邮件还是正常邮件。对于类别我们通常称为正类(positive c 阅读全文
posted @ 2016-07-11 21:52 鹰杰 阅读(414) 评论(0) 推荐(0) 编辑
摘要: 欠拟合、过拟合 如下图中三个拟合模型。第一个是一个线性模型,对训练数据拟合不够好,损失函数取值较大。如图中第二个模型,如果我们在线性模型上加一个新特征项,拟合结果就会好一些。图中第三个是一个包含5阶多项式的模型,对训练数据几乎完美拟合。 模型一没有很好的拟合训练数据,在训练数据以及在测试数据上都存在 阅读全文
posted @ 2016-07-11 21:16 鹰杰 阅读(514) 评论(0) 推荐(0) 编辑
摘要: 实例 首先举个例子,假设我们有一个二手房交易记录的数据集,已知房屋面积、卧室数量和房屋的交易价格,如下表: 假如有一个房子要卖,我们希望通过上表中的数据估算这个房子的价格。这个问题就是典型的回归问题,这边文章主要讲回归中的线性回归问题。 线性回归(Linear Regression) 首先要明白什么 阅读全文
posted @ 2016-07-11 21:07 鹰杰 阅读(472) 评论(0) 推荐(0) 编辑