天晴如许

在网站数据采集和网站分析行业,让数据采集标准化和自动化;由海量日志基于hadoop分析到实时分析;提供Web Analytics工具发挥数据运营威力。

导航

2011年11月28日 #

hadoop面试时可能遇到的问题,你能回答出几个 ?

摘要: 面试hadoop可能被问到的问题,你能回答出几个 ?1、hadoop运行的原理?2、mapreduce的原理?3、HDFS存储的机制?4、举一个简单的例子说明mapreduce是怎么来运行的 ?5、面试的人给你出一些问题,让你用mapreduce来实现? 比如:现在有10个文件夹,每个文件夹都有1000000个url.现在让你找出top1000000url。6、hadoop中Combiner的作用?Src: http://p-x1984.javaeye.com/blog/859843Q1. Name the most common InputFormats defined inHadoop? 阅读全文

posted @ 2011-11-28 00:06 天晴如许 阅读(872) 评论(0) 推荐(0) 编辑

Linux命令之sort的使用

摘要: linux下sort命令使用详解---linux将文本文件内容加以排序命令时间:2010-06-10 21:06来源:未知 作者:Linux安全网点击: 372 次功能说明:将文本文件内容加以排序。 语 法: sort [-bcdfimMnr][-o输出文件][-t分隔字符][+起始栏位-结束栏位][--help][--verison][文件] 补充说明:sort可针对文本文件的内容,以行为单位来排序。 参 数: -b忽略每行前面开始出的空格字符。 -c检查文件是功能说明:将文本文件内容加以排序。语 法:sort[-bcdfimMnr][-o<输出文件>][-t<分隔字符&g 阅读全文

posted @ 2011-11-28 00:02 天晴如许 阅读(465) 评论(0) 推荐(0) 编辑

玩转shell之符号篇

摘要: Shell定义变量:Shell定义变量分为参数变量和状态变量两类,这类变量中的大部分只能被用户读取,而不能用普通的方式对它们重置值,故也称只读Shell变量。1.Shell参数变量$0 命令名。在Shell程序内可以用$0获得调用该程序的名字。$1,$2... Shell程序的位置参量(Csh除了可取这种形式外,还能用$argv[n]表示)。$# 位置参量的个数,不包括命令名(C sh:$#argv)。$* 所有位置参量,即相当于$1,$2,.........。$@ 与$*基本相同,但当用双引号转义时,“$@”还能分解成多个参数,但“$*”则合并成一个参数。如Shell程序有两个参数file1 阅读全文

posted @ 2011-11-28 00:01 天晴如许 阅读(419) 评论(0) 推荐(0) 编辑

Oracle字符串函数

摘要: 这些函数全都接收的是字符族类型的参数(CHR除外)并且返回字符值.除了特别说明的之外,这些函数大部分返回VARCHAR2类型的数值.字符函数的返回类型所受的限制和基本数据库类型所受的限制是相同的。字符型变量存储的最大值:VARCHAR2数值被限制为2000字符(ORACLE 8中为4000字符)CHAR数值被限制为255字符(在ORACLE8中是2000)long类型为2GBClob类型为4GB1、CHR语法: chr(x)功能:返回在数据库字符集中与X拥有等价数值的字符。CHR和ASCII是一对反函数。经过CHR转换后的字符再经过ASCII转换又得到了原来的字符。使用位置:过程性语句和SQL 阅读全文

posted @ 2011-11-28 00:00 天晴如许 阅读(581) 评论(0) 推荐(0) 编辑