代码改变世界

Avro基础

2015-02-14 19:56  jediael  阅读(226)  评论(0编辑  收藏  举报


一、Avro的基本功能

1、定义了数据模式文件的语法,一般使用json文件。以及一些数据基本类型与复杂类型。

2、定义了数据序列化到文件后的数据格式,此格式可供各种语言进行读取。

3、为部分语言定义了序列化文件的读取API,如JAVA等。

4、扩展了hadoop的基本mapreduce,提供了用于使用Avro作为输出框架的mapreduce API。


二、Gora中的avro

在gora中使用avro其实只使用了avro基本功能中的第一个,这个gora官方示例中的说明:

Data beans are the main way to hold the data in memory and persist in Gora. Gora needs to explicitly keep track of the status of the data in memory, so we use Apache Avro for defining the beans. Using Avro gives us the possibility to explicitly keep track of an object's persistent state and a way to serialize an object's data. Defining data beans is a very easy task, but for the exact syntax pleaseconsult the Avro Specification.

详见http://blog.csdn.net/jediael_lu/article/details/43272521


详见《hadoop权威指南》