毛毛的小窝 — 关注技术交流、让我们一起成长

导航

< 2025年3月 >
23 24 25 26 27 28 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31 1 2 3 4 5

统计

Google推出Protocol Buffers:争夺网络时代数据格式

北京时间7月8日消息,据国外媒体报道,谷歌本周一发布了该公司内部使用的开放源代码数据描述语言Protocol Buffers。Protocol Buffers与XML相似,但更简单、更小、更快。

谷歌开放源代码项目经理克里斯·迪邦纳(Chris DiBona)在一篇博文中写道,“我们在网络上传输或在磁盘上存储的几乎所有结构化信息都采用了这种语言。我们认为Protocol Buffers可能对其他人也有用,因此我们决定将它发布为开放源代码软件。”

谷歌软件工程师肯顿·瓦尔达(Kenton Varda)在公司的开放源代码博客上发表文章称,谷歌使用数千种不同的数据格式,其中大多数都是结构化数据格式。XML无法胜任对这些海量结构化数据编码的重任,谷歌于是开发了Protocol Buffers。

瓦尔达将Protocol Buffers比作是一种界面描述语言,但没有界面描述语言的复杂性。他说,Protocol Buffers的主要设计目标之一是简洁。对Protocol Buffers进行解析的速度也很快,比XML要快出至少一个量级。

谷歌的文档称,与具有可比性的XML文件相比,Protocol Buffers文件的尺寸要小3-10倍,解析速度要快20-100倍。

谷歌发布的免费文件包括采用Java、Python和C++编程语言编写的Protocol Buffers编译器源代码。

谷歌在一份文档中表示,该公司还计划将许多其它软件项目发布为开放源代码软件。因为这些项目会用到Protocol Buffers,因此谷歌决定首先将它发布为开放源代码软件。


在Web 2.0 时代,XML格式由于AJAX的风行以及RSS的普及而异军突起。不过随着Python和Ruby On Rails的走红,以及各种API的发布,YAML,JSON也逐渐成名。此次,Google推出了Protocol Buffers,是想让广大编程者方便地使用Google网络传输数据的格式。

什么是Protocol Buffers?

这是Protocol Buffers主页上的一段代码:

message Person {
required string name = 1;
required int32 id = 2;
optional string email = 3;

enum PhoneType {
MOBILE = 0;
HOME = 1;
WORK = 2;
} message PhoneNumber {
required string number = 1;
optional PhoneType type = 2 [default = HOME];
}

repeated PhoneNumber phone = 4;
}

而Protocol Buffers的作用,就是将以上格式的数据类型,自动生成Java, Python, and C++的代码,然后以下一系列代码就可以直接调用了:(C++中)

Person person;
person.set_name("John Doe");
person.set_id(1234);
person.set_email("jdoe@example.com");
fstream output("myfile", ios::out | ios::binary);
person.SerializeToOstream(&output); fstream input("myfile", ios::in | ios::binary);
Person person;
person.ParseFromIstream(&input);
cout << "Name: " << person.name() << endl;
cout << "E-mail: " << person.email() << endl;

相信所有C++编程者都为定义set,get之类的函数感到烦人过吧,而Google做的就是帮助你省去这些麻烦,构造更利于网络传输的数据结构。

与XML的比较 优势

  • 更简单
  • 比XML小3到10倍体积
  • 比XML快20到100倍
  • 更不容易引起歧义
  • 自动生成可编程的类代码
    比较:
    cout << "Name: " << person.name() << endl;

    cout << "E-mail: " << person.email() << endl;
    cout << "Name: "
           << person.getElementsByTagName("name")->item(0)->innerText()
           << endl;
    cout << "E-mail: "
           << person.getElementsByTagName("email")->item(0)->innerText()
           << endl; 劣势
  • 没有层次,所以无法和HTML标记语言打交道
  • 如果没有message的定义,根本无法知道message的意思,而XML是自解释型的。
    Protocol Buffer主页    Protocol Buffer下载

  • posted on   mjgforever  阅读(521)  评论(0编辑  收藏  举报

    编辑推荐:
    · 如何编写易于单元测试的代码
    · 10年+ .NET Coder 心语,封装的思维:从隐藏、稳定开始理解其本质意义
    · .NET Core 中如何实现缓存的预热?
    · 从 HTTP 原因短语缺失研究 HTTP/2 和 HTTP/3 的设计差异
    · AI与.NET技术实操系列:向量存储与相似性搜索在 .NET 中的实现
    阅读排行:
    · 周边上新:园子的第一款马克杯温暖上架
    · Open-Sora 2.0 重磅开源!
    · 分享 3 个 .NET 开源的文件压缩处理库,助力快速实现文件压缩解压功能!
    · Ollama——大语言模型本地部署的极速利器
    · [AI/GPT/综述] AI Agent的设计模式综述
    点击右上角即可分享
    微信分享提示