另说贝叶斯算法
对于贝叶斯算法看了好多书中举的例子,比如抛100次硬币,石子以及太阳的出生落下,不过觉得这些例子都完全脱离于实际,是一种很完全的抽象,迫使学习的人想不出来那种场景也在那想,很是痛苦,为什么就不能用通俗的方法来举例呢?
于是,生活中的观察,我个人觉得,还是用上厕所的问题来描述贝叶斯算法可能要比较好理解些.
比如有一个人到另外一个公司办事,中间想要去”方便”一下,碰巧男女洗手间大门外的标牌被扫厕所的大妈给”收拾”掉了,这样他就无法通过明显的标记判断哪个是男洗手间哪个是女洗手间.但是,他之所以不会在外面憋死就是因为他后来发现,所有的这家公司的男员工都走这个门,所有的女员工都会走另外一个门,于是,即使没有门上的标签,他也能判断出来,因为他所看到(记录)的每一个门里的进出情况,就可以说明一切问题.当然,即使有走洗手间的同志,这样的记录正是所谓的垃圾数据.
在很多教材中,抛硬币的那个,书中非要你构建一种抛100次完全是正面的场景,然后又强迫你根据这个”现象”来判断101次是什么样的.当然,现实生活中,两面的硬币,100次能完全一样在初学者脑力是不可能的事情,人总是这样,在刚开始的时候设想不可能的一个场景是很困难的.
日出日落的这个,多少还容易理解些,但这都是地球人都知道的事,并且一个婴儿懂得这样的纪录那可真是天才,要么就是外星人.天啊,不晓得第一个遍出这个事例的人到底要说明什么.
---------------------------------------------------------------
aspnetx的BI笔记系列索引:
使用SQL Server Analysis Services数据挖掘的关联规则实现商品推荐功能
---------------------------------------------------------------