摘要:
计算topNwords的topology,用于比如trendingtopicsortrendingimagesonTwitter.实现了滑动窗口计数和TopN排序,比较有意思,具体分析一下代码Topology这是一个稍微复杂些的topology,主要体现在使用不同的grouping方式,fields... 阅读全文
摘要:
计算topNwords的topology,用于比如trendingtopicsortrendingimagesonTwitter.实现了滑动窗口计数和TopN排序,比较有意思,具体分析一下代码Topology这是一个稍微复杂些的topology,主要体现在使用不同的grouping方式,fields... 阅读全文
摘要:
http://edu.51cto.com/roadmap/view/id-29.htmlhttp://my.oschina.net/infiniteSpace/blog/308401大数据实时计算工程师/Hadoop工程师/数据分析师职业路线图描述本路线图是一个专门针对大数据实时处理、Hadoop工... 阅读全文
摘要:
vim 查找字符串出现的次数在所有行中查找 字符串 出现的次数:%s/字符串/&/gn在m和n行之间查找 字符串 出现的次数:m,ns/字符串/&/gn 阅读全文
摘要:
一、安装MySQL 1、下载源码包 从mysql官网上下载linux下的source包mysql-5.0.51b.tar.gz,注意是下载GNU tar格式的,不是rpm包。 2、解包tarxvfmysql-5.0.51b.tar.gz 3、进入mysql目录cdmysql-5.0.51b 4、安装... 阅读全文
摘要:
首先安装apache、mysql和php,依次顺序安装。1.apache、mysql的安装比较简单,略过2. php的安装,我安装的是php5.3.6内置了php-fpm,所以不需要再单独下补丁了。./configure –prefix=/usr/local/php5 /--with-mysql=/... 阅读全文
摘要:
http://www.92csz.com/study/linux/16.htm1.apache在如下页面下载apache的for Linux 的源码包http://www.apache.org/dist/httpd/;存至/home/xx目录,xx是自建文件夹,我建了一个wj的文件夹。命令列表: c... 阅读全文
摘要:
sed 命令可以很好的进行行匹配,但从某一行中精确匹配某些内容,则使用 grep 命令并辅以 -o 和 -E 选项可达到此目的。其中 -o 表示“only-matching”,即“仅匹配”之意。光用它不够,配合 -E 选项使用扩展正则表达式则威力巨大。比如下面有一条文本 tmp.txt ,其中内容为... 阅读全文
摘要:
这节详细介绍awk内置函数,主要分以下3种类似:算数函数、字符串函数、其它一般函数、时间函数一、算术函数:以下算术函数执行与 C 语言中名称相同的子例程相同的操作:函数名说明atan2( y, x )返回 y/x 的反正切。cos( x )返回 x 的余弦;x 是弧度。sin( x )返回 x 的正... 阅读全文
摘要:
HBase是Google Bigtable的开源实现,它利用Hadoop HDFS作为其文件存储系统,利用Hadoop MapReduce来处理HBase中的海量数据,利用Zookeeper作为协同服务。1. 简介HBase是一个分布式的、面向列的开源数据库,源于google的一篇论文《bigtab... 阅读全文
摘要:
本文主要是从HBase应用程序设计与开发的角度,总结几种常用的性能优化方法。有关HBase系统配置级别的优化,这里涉及的不多,这部分可以参考:淘宝Ken Wu同学的博客。1. 表的设计1.1 Pre-Creating Regions默认情况下,在创建HBase表的时候会自动创建一个region分区,... 阅读全文
|