摘要:Apriori算法是机器学习的一个基础算法,用于找出频繁项集,也即为购物篮算法。但是Apriori算法要多次遍历全量数据,效率较低,FP-Growth算法是对Apriori算法的改进(见韩家炜《数据挖掘:概念与技术》),而PFP-Growth算法是对FP-Growth进行了Map-Reduce化,使FP-Growth能够处理海量的数据。 PFP-Growth算法论文见http://infolab... 阅读全文
为知笔记(Wiz)发布博客到博客园(cnblog)
2014-03-31 13:28 by Digging4, 301 阅读, 0 推荐, 收藏, 编辑
摘要:[wiz官设置](http://blog.wiz.cn/wiz-plugin-blog-writter.html)在wiz中,把文章题目后面加上 .md ,编辑器中会显示渲染过的markdown文件这个是**粗体**公式\[m\ddot{x}+c\dot{x}+kx=0\]\[\ddot{x}+2\xi\omega_n\dot{x}+\omega_n^2x=0\]\[x(t)=e^{-\xi\om... 阅读全文
博客园使用Markdown和公式
2014-03-28 16:39 by Digging4, 549 阅读, 0 推荐, 收藏, 编辑
摘要:今天开通了博客园博客,刚才在网上搜罗了一下,发现有两个惊喜:1、可以使用Markdown;2、内置支持公式。####1、Markdown支持开通 博客后台选项中,默认编辑器选择“Markdown”即可。 ![](http://images.cnitblog.com/blog/618186/201403/281636112668761.jpg)####2、公式支持 博客后台选项中设置。 ![](http://images.cnitblog.com/blog/618186/201403/281636545167814.jpg) 公式示例 这是一个行内公式 $\sqrt{3... 阅读全文
Hadoop及Mahout的安装
2014-03-28 16:12 by Digging4, 647 阅读, 0 推荐, 收藏, 编辑
摘要:本文描述了Hadoop及Mahout的安装。环境如下:主机:win7 64位,4G内存(host为笔记本,通过无线路由上网)虚拟机:两台,virtualbox,Linux版本为centos(机器名为bk01,bk02)第一步:在虚拟机上安装centos1、按照常规安装,由于实验环境对性能要求不高,每个虚拟机配置512M内存。centos在512M内存下默认不安装图形界面。2、安装后的配置(两个虚拟机同样配置):a)virtualbox 网卡设置为桥接,选择无线网卡 b)修改网络配置 vi /etc/sysconfig/network-scripts/ifcfg-eth0 按下图描述... 阅读全文