随笔分类 -  DataMining

Polya urn model (Polya 罐子模型) [转]
摘要:Polya urn modelFrom Wikipedia, the free encyclopediaInstatistics, aPolya urn model(also known as aPolya urn schemeor simply asPólya's urn), named afterGeorge Pólya, is a type ofstatistical modelused as an idealizedmental exerciseto understand the nature of certain statistical distribut 阅读全文

posted @ 2012-09-15 21:55 龙豆 阅读(3320) 评论(0) 推荐(0) 编辑

Gibbs Sampling [转]
摘要:1、Sampling初探:计算机可以使用一种随机算法来计算圆周率PI,方法是在边长为d正方形的范围内不断地产生随机数,正方形内切一个直径为d的圆,设C为落入这个圆内点的个数,S为正方形内所有点的个数,则:这就是蒙特卡洛法,每次产生的随机数就是一次Sampling。2、为什么需要sampling设进行了10次抛硬币实验,结果是HHHHTTTT(H代表正面,T代表反面),已知硬币正反面是不均匀的,要求估计下一次抛硬币的结果。使用最大似然法进行估计:第一步使用最大似然的原则估计出出现正面的概率:然后用这个用最大似然估计出来PI的去预测下次出现正反面的结果。使用最大后验概率原则进行估计:前面两种方法都 阅读全文

posted @ 2012-09-14 13:18 龙豆 阅读(3432) 评论(0) 推荐(0) 编辑

随机模拟的基本思想和常用采样方法(sampling) [转]
摘要:通常,我们会遇到很多问题无法用分析的方法来求得精确解,例如由于式子特别,真的解不出来;一般遇到这种情况,人们经常会采用一些方法去得到近似解(越逼近精确解越好,当然如果一个近似算法与精确解的接近程度能够通过一个式子来衡量或者有上下界,那么这种近似算法比较好,因为人们可以知道接近程度,换个说法,一般一个近似算法被提出后,人们通常都会去考察或寻求刻划近似程度的式子)。本文要谈的随机模拟就是一类近似求解的方法,这种方法非常的牛逼哦,它的诞生虽然最早可以追溯到18xx年法国数学家蒲松的投针问题(用模拟的方法来求解\pi的问题),但是真正的大规模应用还是被用来解决二战时候美国佬生产原子弹所碰到的各种难以解 阅读全文

posted @ 2012-09-14 13:17 龙豆 阅读(7782) 评论(1) 推荐(1) 编辑

PLSA LDA相关汇总
摘要:1. PLSA与LSA http://hi.baidu.com/megachan/blog/item/8bd11a83bc934baa6c811995.html2.Simple Introduction to Dirichlet Process http://hi.baidu.com/zcfeiyu123/blog/item/c1fb38dad544ae275982dd97.html3.Beta分布Dirichlet分布conjugateprior http://blog.sina.com.cn/s/blog_64827e4c0100id8g.html4.introduction to LDA 阅读全文

posted @ 2012-07-08 22:11 龙豆 阅读(276) 评论(0) 推荐(0) 编辑

Lucene学习总结系列 [转]
摘要:见:http://blog.csdn.net/forfuture1978/article/category/604866 阅读全文

posted @ 2012-05-09 11:29 龙豆 阅读(151) 评论(0) 推荐(0) 编辑

导航

< 2025年3月 >
23 24 25 26 27 28 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31 1 2 3 4 5
点击右上角即可分享
微信分享提示