Hadoop的简单序列化框架

Hadoop提供了一个加单的序列化框架API,用于集成各种序列化实现。该框架由Serialization实现。

 

其中Serialization是一个接口,使用抽象工厂的设计模式,提供了一系列和序列化相关并相互依赖对象的额接口。通过Serialization应用可以获得类型的Serializer实例,即将一个对象转化为一个字节流的实现实例;Deserializer实例和Serializer实例相反,它用于将字节流转为一个对象。

/**
 * 
 * 包装一个序列化/反序列化对 (抽象工厂类)*/
public interface Serialization<T> {
  
  /**
   * 允许客户端进行测试给的序列化是否支持给定的类
   */
  boolean accept(Class<?> c);
  /**
   * 获得用于序列化对象的Serializer实现
   */
  Serializer<T> getSerializer(Class<T> c);

  /**
   * 获得用于反序列化对象的Deserializer实现*/
  Deserializer<T> getDeserializer(Class<T> c);
}

如果需要使用Serializer来执行序列化,一般需要通过Open方法来打开Serializer,open()方法传入一个底层的流对象,然后就可以使用serializer()方法序列化对象对底层的流中。最后序列化结束时,通过close()方法关闭Serializer。
Hadoop目前支持两个Serialization实现分别是支持W日table机制的WritableSerialization和支持Java序列化的JavaSerialization。通过JavaSerialization可以再MapReduce程序中方便的使用java类型,如int或String,但Java的ObjectSerialization不如Hadoop的徐燮华机制有效,非特殊情况不要尝试

 

posted @ 2015-04-21 11:06  cjt1991  阅读(185)  评论(0编辑  收藏  举报