摘要:
上一次,我介绍了贝叶斯推断的原理,今天讲如何将它用于垃圾邮件过滤。========================================(接上文)七、什么是贝叶斯过滤器?垃圾邮件是一种令人头痛的顽症,困扰着所有的互联网用户。正确识别垃圾邮件的技术难度非常大。传统的垃圾邮件过滤方法,主要有"关键词法"和"校验码法"等。前者的过滤依据是特定的词语;后者则是计算邮件文本的校验码,再与已知的垃圾邮件进行对比。它们的识别效果都不理想,而且很容易规避。2002年,Paul Graham提出使用"贝叶斯推断"过滤垃圾邮件。他说,这样做的效 阅读全文
摘要:
一年前的这个时候,我正在翻译Paul Graham的《黑客与画家》。那本书大部分谈的是技术哲学,但是第八章却写了一个非常具体的技术问题----如何使用贝叶斯推断过滤垃圾邮件(英文版)?说实话,我没完全看懂那一章。那时,交稿截止日期已经过了,没时间留给我去啃概率论教科书了。我只好硬着头皮,按照字面意思把它译了出来。虽然交稿了,译文质量也还可以,但是心里很不舒服,下决心一定要搞懂它。一年过去了,我读了一些概率论文献,逐渐发现贝叶斯推断并没有想象的那么难。相反的,它的原理部分实际上很容易理解,甚至不需要用到高等数学。下面就是我的学习笔记。需要声明的是,我并不是这方面的专家,数学其实是我的弱项。所以, 阅读全文
摘要:
在前端开发过程中会遇到很多工具,我接触的主要的前端工具整理了一下有:1.Firebughttp://getfirebug.com/最流行的前端开发工具2.HttpWatchhttp://www.httpwatch.com/集成在IE和Firefox上的监听HTTP和HTTPS的工具3.Fiddlerhttp://www.fiddler2.com/fiddler2/Fiddler是一个记录你电脑和网络之间所有HTTP(S)请求的网络调试代理4.HttpFoxhttps://addons.mozilla.org/eu/firefox/addon/6647?lang=en-US和HTTPWatch很 阅读全文
摘要:
转载自陈成的博客http://www.chencheng.org/blog/2008/10/25/f2e-manual/ps:这个手册整理的确实牛叉,非常全面,感谢陈成同学,在开发过程中可以随时看看学习。一直觉得前端开发缺个手册,这是个体力活。不过总得有人来干。今天闲来无事,把一些工具(online和client的)、常用网 址、以及经验总结等罗列出来和大家分享下。这个标题起地大了点,肯定会有很多地方没列到,包括类目的分法也可能考虑不周,所以还请大家积极补充指正,可以 直接留言,也可以发邮件给我(sorrycc#gmail.com)。之所以加上“大众”两字,因为以下资源对于高手来说可能早就很熟 阅读全文
摘要:
对于 Unix 族下的文本编辑器,VI 功能稍弱,Emacs 的能力是没得说,但学习曲线太陡峭了,于是簇拥到 TextMate 旗下。快捷键能让你大大的提 升使用的效率,它可以让你的手尽量少在键盘与鼠标之间飘来飘去。相比于 Windows 平台,Mac 更推崇使用快捷键来操作,搭配着大大的触摸板后,鼠标真的就有点多余了。这里列出的所谓通用快捷键是不怎么涉及那些 Bundle 中的特定的快捷键而言的,还有些是系统通用的快捷方式也会提到1. mate 命令:mate . 以当前目录启动一个项目mate a.txt b.txt *.csv afolder afolder/bfolder 指定文件.. 阅读全文