PRML-4 分类的线性模型

一些记号

1.

x

2.

Ck,k=1,2,...,K,K

3.//

D(D1)

y(x)=constantwTx+w0=constant

4.

t

t0,1t=1C1t=0C2

K>2,使1ofK

2.三种解决分类的办法

  • 1.最简单的方法是构造一个直接把向量x分到具体的类别中判别函数(discriminant function)
  • 2.一个更强大的方法是在推断阶段对条件概率分布p(Ck|x)进行建模,然后使用这个概率分布进行最优决策
    • 有两种不同的方法来确定条件概率p(Ck|x)
    • 2.1 一种是直接对它建模,例如把条件概率分布表示为参数模型,然后使用训练集来最优化参数
    • 2.2 另一种是生成式的方法。在这种方法中,我们对类条件概率密度p(x|Ck)以及先验概率分布p(Ck)建模,然后使用贝叶斯定理来计算需要的后验概率分布
      (4.2)p(Ck|x)=p(x|Ck)p(Ck)p(x)

3.激活函数

模型的预测y(x,w)是由参数w的线性函数给出的。在最简单的情况下,模型对输入变量也是线性的,因此形式为y(x)=wTx+w0,即y是一个实数。然而对于分类问题,我们想预测的是离散的类别标签,或更一般地,预测位于区间(0,1)的后验概 率。为了达到这个目的,我们考虑使用非线性函数f()˙w的线性函数进行变换,来推广这个模型,即

(4.3)y(x)=f(wTx+w0)

在机器学习的文献中f()˙被称为激活函数(activation function),而它的反函数在统计文献中被称为链接函数(link function)

posted @   筷点雪糕侠  阅读(51)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· DeepSeek 开源周回顾「GitHub 热点速览」
· 物流快递公司核心技术能力-地址解析分单基础技术分享
· .NET 10首个预览版发布:重大改进与新特性概览!
· AI与.NET技术实操系列(二):开始使用ML.NET
· .NET10 - 预览版1新功能体验(一)
点击右上角即可分享
微信分享提示