摘要: 1.内置运算符1.1关系运算符运算符类型说明A = B所有原始类型如果A与B相等,返回TRUE,否则返回FALSEA == B无失败,因为无效的语法。 SQL使用”=”,不使用”==”。A <> B所有原始类型如果A不等于B返回TRUE,否则返回FALSE。如果A或B值为”NULL”,结果返回”NULL”。A < B所有原始类型如果A小于B返回TRUE,否则返回FALSE。如果A或B值为”NULL”,结果返回”NULL”。A <= B所有原始类型如果A小于等于B返回TRUE,否则返回FALSE。如果A或B值为”NULL”,结果返回”NULL”。A > B所有原始类 阅读全文
posted @ 2012-12-27 11:19 rilley 阅读(285) 评论(1) 推荐(0) 编辑
摘要: Hive 简明指南原文http://www.cnblogs.com/end/archive/2012/06/18/2553683.html1. 基本数据类型tinyint , smallint, int, bigint, float, double, boolean: true/false, string2. 基础运算符与函数A IS NULL 空A IS NOT NULL 非空A LIKE B 模糊匹配A RLIKE B 正则表达式匹配A REGEXP B 正则表达式匹配3. 类型转换cast(expr as <type>)例如:cast('1' as BIGIN 阅读全文
posted @ 2012-12-27 10:58 rilley 阅读(313) 评论(0) 推荐(0) 编辑
摘要: \工厂方法意图定义一个用于创建对象的接口,让子类决定实例化哪一个类。Factory Method使一个类的实力化延迟到其子类。别名虚构造器适用性当一个类不知道他所必须创建的对象的类的时候当一个类希望由他的子类来指定他所创建的对象的时候当类将创建对象的职责委托给多个帮助子类中的一个,并且希望将哪一个帮助子类时代理者这一信息局部化的时候。参与者Product定义工厂方法所创建的对象的接口ConcreteProduct实现Product接口Creator声明工厂方法,该方法返回一个Product类型的对象。Creator也可以定义一个工厂方法的缺省实现,他翻回一个缺省的ConcreteProduct 阅读全文
posted @ 2012-12-16 21:16 rilley 阅读(331) 评论(0) 推荐(0) 编辑
摘要: package org.riley.tree;import java.util.Random;/** * 保存int的集合 集合中的元素存放在B-树中 * * @author dou * */public class IntBalancedSet implements Cloneable { private static final int MINIMUM = 2;// 非根节点中最少存放的元素个数 private static final int MAXIMUM = 2 * MINIMUM;// 节点中最多存放的元素个数 int dataCount;// 存放节点中元素... 阅读全文
posted @ 2012-12-09 16:03 rilley 阅读(336) 评论(0) 推荐(0) 编辑
摘要: check-native-uptodate:compile-native: [javah] Error: Class org.apache.hadoop.conf.Configuration could not be found.BUILD FAILED/home/hadoop/src/kevinweil-hadoop-lzo-6bb1b7f/build.xml:269: compilation failed在build.xml中添加<classpath refid="classpath"/><javah classpath="${build.c 阅读全文
posted @ 2012-12-04 16:55 rilley 阅读(598) 评论(0) 推荐(0) 编辑
摘要: 索引结构一个数据文件可以用来存储一个关系。一个数据文件可能拥有一个或多个索引文件,每个索引文件建立查找键和数据记录之间的关联,查找键的指针指向于查找键相同属相值得记录。索引可以是稠密的,以数据文件中每个记录在索引文件中都设有一个索引项。也可以是稀疏的,即数据文件中只有一些记录在索引文件中表示出来,通常为每个数据块在索引文件中设一个索引项。索引还可以是主索引或者辅助索引。顺序文件顺序文件是对关系中的元祖按主键进行排序而生成的文件。关系中的元祖按照这个次序分布在多个数据块中。稠密索引如果记录是排好序的,我们就可以在记录上建立稠密索引。块中只存放记录的键以及只想记录本身的指针。稠密索引文件中的索引块 阅读全文
posted @ 2012-12-02 11:32 rilley 阅读(234) 评论(0) 推荐(0) 编辑
摘要: MRUnit MRUnit是一款由Couldera公司开发的专门针对Hadoop中编写MapReduce单元测试的框架。定义Map逻辑import java.io.IOException;import org.apache.hadoop.io.*;import org.apache.hadoop.mapreduce.Mapper;public class WordMapper extends Mapper<LongWritable, Text, Text, Text> { @Override public void map(LongWritable key, Text value. 阅读全文
posted @ 2012-11-30 10:20 rilley 阅读(378) 评论(0) 推荐(0) 编辑
摘要: Maven<?xml version=”1.0” encoding=”utf-8” ?><project xmlns=http://maven.apache.org/POM/4.0.0xmlns:xsi="http://www .w3.org/2001/XMLSchema-instance"xsi:schemaLocation="http://maven.apache.org/POM/4.0.0http://maven.apache.org/maven-v4_0_0.xsd"> <modelVersion>4.0.0& 阅读全文
posted @ 2012-11-18 22:11 rilley 阅读(1268) 评论(0) 推荐(1) 编辑
摘要: python在安装时,默认的编码是ascii,当程序中出现非ascii编码时,python的处理常常会报这样的错UnicodeDecodeError: 'ascii' codec can't decode byte 0x?? in position 1: ordinal not in range(128),python没办法处理非ascii编码的,此时需要自己设置将python的默认编码,一般设置为utf8的编码格式。查询系统默认编码可以在解释器中输入以下命令: sys.getdefaultencoding() 设置默认编码时使用: sys.setdefaultenco 阅读全文
posted @ 2012-11-09 16:55 rilley 阅读(821) 评论(0) 推荐(0) 编辑
摘要: TestNG annotaion:@DataProvider@ExpectedExceptions@Factory@Test@Parameters<suite name="ParametersTest"> <test name="Regression1"> <classes> <class name="com.example.ParameterSample" /> <class name="com.example.ParameterTest"> <m 阅读全文
posted @ 2012-11-09 16:09 rilley 阅读(4371) 评论(0) 推荐(0) 编辑
摘要: 对于所有对象都同用的方法1 考虑用静态工厂方法替代构造器类可以提供一个公有的静态工厂方法,他只是一个返回类的实例的静态方法。实例受控类public static Boolean valueOf(boolean b){ return b ? Boolean.TRUE : Boolean.FALSE;}编写实例受控类有几个原因。实例受控使得类可以确保他是一个Singleton或者是不可实例化的。他还使得不可变类可以确保不会存在两个相等的实例。API可以返回对象,同时又不会使对象的类变成公有的。以这种方式隐藏实现类会使API变得非常简介。这种结束适用于基于接口的框架(java.util.Col... 阅读全文
posted @ 2012-10-24 17:58 rilley 阅读(1076) 评论(0) 推荐(0) 编辑
摘要: 死锁原因系统资源不足线程运行顺序不合适资源分配不当必要条件互斥条件:一个资源只能被一个线程使用请求和保持条件:一个线程因请求资源而阻塞时,对已获的资源保释不放不剥夺条件:线程已获得的资源,在未使用完之前不能强行剥夺循环等待条件:若干线程之间形成一种首尾相接的循环等待资源关系预防死锁资源一次性分配:(破坏请求和保持条件)可剥夺资源:当某线程新的资源未满足时,释放已占有资源(破坏不剥夺条件)资源有序分配法:给每个资源赋予一个编号,每一个线程按照编号递增的顺序请求资源,释放则相反(破坏循环等待条件)解除死锁撤销限于死锁的全部线程逐个撤销限于死锁的线程,直到死锁不存在从陷于思所得线程中逐个强迫放弃所占 阅读全文
posted @ 2012-10-24 11:51 rilley 阅读(386) 评论(1) 推荐(0) 编辑
摘要: Log4J的配置文件(Configuration File)就是用来设置记录器的级别、存放器和布局的,它可接key=value格式的设置或xml格式的设置信息。通过配置,可以创建出Log4J的运行环境1. 配置文件Log4J配置文件的基本格式如下: #配置根Loggerlog4j.rootLogger = [ level ] , appenderName1 , appenderName2 , …#配置日志信息输出目的地Appenderlog4j.appender.appenderName = fully.qualified.name.of.appender.class log4j.appe.. 阅读全文
posted @ 2012-09-27 18:14 rilley 阅读(257) 评论(0) 推荐(0) 编辑
摘要: public class KnnTest { public static void readFileToList(String path, List<List<Double>> list) { BufferedReader br = null; try { br = new BufferedReader(new FileReader(path)); while (br.ready()) { String line = br.readLine(); ... 阅读全文
posted @ 2012-09-18 09:59 rilley 阅读(651) 评论(0) 推荐(0) 编辑
摘要: org.apache.hadoop.io.WritableUtils 1 public static void writeVLong(DataOutput stream, long i) throws IOException 2 { 3 // 直接写数据 4 if (i >= -112 && i <= 127) { 5 stream.writeByte((byte) i); 6 return; 7 } 8 9 int len = -112;10 1... 阅读全文
posted @ 2012-08-16 16:12 rilley 阅读(414) 评论(0) 推荐(0) 编辑