序列化(Serialization)

  1. 一直对序列化这块比较迷糊,也比较感兴趣。
  2. 序列化(Serialization)是将结构化对象转换为字节流数据用来在网络中传输,或者写到持久话存储(persistent storage)。
  3. 反序列化(Deserialization)是一个相反的过程,将字节流数据转换为一系列的结构化对象。(这点,一直不是很理解。。。)
  4. 序列化主要应用分布式数据处理的两个不同的领域,进程通信(interprocess communication)和持久话存储(persistent storage)
  5. Hadoop中,不同节点进程间的通信通过使用RPCs(remote procedure calls),RPC协议就是通过序列化讲信息转化为二进制流传输到远节点,对方反序列化为原始的信息。
  6. 一个RPC序列化模式应该:
    • 简洁(Compact),简洁的格式能够更好的使用网络带宽,这是在数据中心中最稀缺的资源。
    • 快速(Fast),进程通信是分布式系统的骨干,所以序列化和返序列过程不能带来太大的开销
    • 扩展性(Extensible),协议一直在变化满足新的需求,因此它需要在可控的范围内直接的扩展协议,包扩可魂断和服务端。
    • 互操作(Interoperable),一些系统客户端是通过不同语言写的,因此我们需要来满足这个
posted @ 2016-03-07 19:20  dalu610  阅读(265)  评论(0编辑  收藏  举报