序列化之Apache Thrift

Apache Thrift和ProtoBuf一样,都是为优化序列化而生,Thrift是一个通信框架,最初有FaceBook开发,后交由Apache管理,目前Facebook也在使用。Thrift与ProtoBuf同样是跨平台多语言的,不过Thrift几乎支持现下的所有流行的语言,而ProtoBuf.net是.net的移植,相比而来Thrift支持更广。我这里做的是对Thrift序列化数据在效率做实验

1.定义接口文件

相当于数据契约。Thrift的契约定义用了自己的一套语法(IDL),这样做的目的是让他可以跨语言,同一套契约可以在任何语言下使用,关于IDL方法可以去参考Thrift的白皮书

和上一篇文章相同,有以下这样两个类

public class Person
    {
        public int Id { get; set; }]
        public string Name { get; set; }
        public Address Address { get; set; }
    }


    public class Address
    {
        public string Line1 { get; set; }
        public string Line2 { get; set; }
    }

用Thrift 的IDL语言定义后如下,文件保存为test.idl

struct Address
{
        1: string Line1,
        2: string Line2
}
struct Person
{
        1: i32 Id,
        2: string Name,
        3: Address Address
}

2. 使用Thrift提供的windows编译器生成文件

使用thrift-0.9.1.exe生成文件,将test.idl与thrift-0.9.1.exe放在同级目录下,在控制台是执行命令

thrift-0.9.1 --gen csharp test.idl

文件生成在目录下的gen-csharp文件夹中

Address.cs

Person.cs

 

3. 添加Thrift.dll

下载thrift-0.9.1.tar.gz解压后找到对应的C#代码编译后就得到Thrift.dll了

捕获

4. 序列化数据

创建一个C#控制台应用程序,将生成的两个代码文件添加到项目中,再添加Thrift.dll引用,和上次一样序列化同样的1000条数据,得到的数据大小为48.7 KB (49,890 字节)

    class Program
    {
        static void Main(string[] args)
        {
            Person person = new Person { Address = new Address { Line1 = "Line1", Line2 = "Line2" }, Id = 1, Name = "Name" };
            using (System.IO.Stream stream = System.IO.File.Create("Person.dat"))
            {
                Thrift.Transport.TTransport transport = new Thrift.Transport.TStreamTransport(null,stream);
                Thrift.Protocol.TProtocol protocol = new Thrift.Protocol.TBinaryProtocol(transport);
                List<Person> list = new List<Person>();
                for (int i = 0; i < 1000; i++)
                {
                    Person item = new Person { Address = new Address { Line1 = "Line1", Line2 = "Line2" }, Id = i, Name = "Name" + i };
                    item.Write(protocol);
                }
            }

        }
    }

Demo下载

对比上次的ProtoBuf大了不少,和C#的原始二进制序列化只差5kb。当然我这次对比几个数据也不能说明什么问题,只能做个大概了解。网络通信是个复杂的过程。序列化数据大小直接影响网络带宽,序列化与反序列化的效率也直接影响着服务器资源。当数据量大小上升到不同数量级时ProtoBuf和Thrift到底谁更占上风我就法验证了。

Thrift是个网络通信框架,提供了多种数据序列化方式,并且支持多种语言,通过Thrift的IDL语言定义过的契约可以在所有支持的语言上使用,且与平台无关,这就是他NB的地方。从Thrift的Tutorial看来对现将通信协议迁移也不是件事。

posted @ 2014-01-05 01:53  徐某人  阅读(3142)  评论(0编辑  收藏  举报