摘要:
在学习LDA之前,有必要将其自然语言处理领域的LDA区别开来,在自然语言处理领域, LDA是隐含狄利克雷分布(Latent Dirichlet Allocation,简称LDA),是一种处理文档的主题模型。本文只讨论线性判别分析,因此后面所有的LDA均指线性判别分析。 线性判别分析 LDA: lin 阅读全文
posted @ 2019-01-15 20:08
nxf_rabbit75
阅读(1846)
评论(0)
推荐(0)
摘要:
一、感知机(Perception) 1.1 原理: 感知机是二分类的线性模型,其输入是实例的特征向量,输出的是事例的类别,分别是+1和-1,属于判别模型。 假设训练数据集是线性可分的,感知机学习的目标是求得一个能够将训练数据集正实例点和负实例点完全正确分开的分离超平面。如果是非线性可分的数据,则最后 阅读全文
posted @ 2019-01-15 16:26
nxf_rabbit75
阅读(902)
评论(0)
推荐(0)
摘要:
1.最小二乘法解的的推导,几何意义解释最小二乘法 2.从概率的角度解释最小二乘法 结论:最小二乘法等价于最大似然估计(条件是噪音需要满足高斯分布) 3. L2正则化 岭回归 因为最小二乘法任意过拟合,所以引入了正则化。 Ridge:假设先验满足高斯分布,使用L2正则化(权重衰减) Lasso:假设先 阅读全文
posted @ 2019-01-15 16:12
nxf_rabbit75
阅读(507)
评论(0)
推荐(0)
摘要:
频率派 贝叶斯派 theta是个未知的常量,X是随机变量, theta是个随机变量,X是随机变量 MLE最大似然估计 MAE最大后验概率 统计机器学习,优化问题 1)建立模型、概率 2)定义损失函数 3)梯度下降/牛顿法求解 概率图模型 求积分(用蒙特卡洛方法取样) 阅读全文
posted @ 2019-01-15 15:51
nxf_rabbit75
阅读(766)
评论(0)
推荐(0)