摘要: EM的算法流程: 初始化分布参数θ; 重复以下步骤直到收敛: E步骤:根据参数初始值或上一次迭代的模型参数来计算出隐性变量的后验概率,其实就是隐性变量的期望。作为隐藏变量的现估计值: M步骤:将似然函数最大化以获得新的参数值: 这个不断的迭代,就可以得到使似然函数L(θ)最大化的参数θ了。那就得回答 阅读全文
posted @ 2017-06-19 22:40 陈泽泽 阅读(391) 评论(0) 推荐(0) 编辑
摘要: 初始目的 将样本分成K个类,其实说白了就是求一个样本例的隐含类别y,然后利用隐含类别将x归类。由于我们事先不知道类别y,那么我们首先可以对每个样例假定一个y吧,但是怎么知道假定的对不对呢?怎样评价假定的好不好呢? 我们使用样本的极大似然估计来度量,这里就是x和y的联合分布P(x,y)了。如果找到的y 阅读全文
posted @ 2017-06-19 21:12 陈泽泽 阅读(2425) 评论(0) 推荐(0) 编辑
摘要: 判别式模型(discriminative model) 产生式模型(generative model) 特点 寻找不同类别之间的最优分类面,反映的是异类数据之间的差异 对后验概率建模,从统计的角度表示数据的分布情况,能够反映同类数据本身的相似度 区别(假定输入x, 类别标签y) 估计的是条件概率分布 阅读全文
posted @ 2017-06-19 10:38 陈泽泽 阅读(6499) 评论(0) 推荐(0) 编辑
摘要: 附: 所有chromedriver均可在下面链接中下载到: http://chromedriver.storage.googleapis.com/index.html 阅读全文
posted @ 2017-06-19 09:30 陈泽泽 阅读(800) 评论(0) 推荐(0) 编辑