.net下二进制序列化的格式分析[转]
作者:zfive5
email:zfive5@yahoo.com.cn
相应c#下的序列化代码如下所示,程序把序列化后的数据存入了一个指定的文件file.bin里,分析这个文件数据主要为了能让非.Net下的应用程序读取序列化后数据,这有助于.net与其他语言平台的交互.
using System;
using System.Drawing;
using System.Collections;
using System.ComponentModel;
using System.Windows.Forms;
using System.Data;
namespace WindowsApplication2
{
[Serializable]
public class Object5
{
public int i1 = 0;
public int i2 = 0;
public float f3=0;
public string str;
}
public class Form1 : System.Windows.Forms.Form
{
private System.Windows.Forms.Button button1;
private System.ComponentModel.Container components = null;
public Form1()
{
InitializeComponent();
}
protected override void Dispose( bool disposing )
{
if( disposing )
{
if (components != null)
{
components.Dispose();
}
}
base.Dispose( disposing );
}
#region Windows 窗体设计器生成的代码
private void InitializeComponent()
{
this.button1 = new System.Windows.Forms.Button();
this.SuspendLayout();
this.button1.Location = new System.Drawing.Point(72, 72);
this.button1.Name = "button1";
this.button1.Size = new System.Drawing.Size(128, 32);
this.button1.TabIndex = 0;
this.button1.Text = "button1";
this.button1.Click += new System.EventHandler(this.button1_Click);
this.AutoScaleBaseSize = new System.Drawing.Size(6, 14);
this.ClientSize = new System.Drawing.Size(292, 273);
this.Controls.Add(this.button1);
this.Name = "Form1";
this.Text = "Form1";
this.ResumeLayout(false);
}
#endregion
[STAThread]
static void
{
Application.Run(new Form1());
}
private void button1_Click(object sender, System.EventArgs e)
{
Object5 obj = new Object5();
obj.i1 = 128;
obj.i2 = 24;
obj.f3=1.3f;
obj.str = "Some String";
double d1=1.3d;
float f1=1.3f;
int i1=1;
string s1="HelloWorld";
System.Runtime.Serialization.IFormatter formatter = new System.Runtime.Serialization.Formatters.Binary.BinaryFormatter();
System.IO.Stream stream = new System.IO.FileStream("File.bin", System.IO.FileMode.Create, System.IO.FileAccess.Write, System.IO.FileShare.None);
formatter.Serialize(stream, obj);
formatter.Serialize(stream,d1);
formatter.Serialize(stream,f1);
formatter.Serialize(stream,i1);
formatter.Serialize(stream,s1);
stream.Close();
formatter=null;
}
}
}
文件内容如下图所示:
注解:
1 )00 01 00 00 00 FF FF FF FF 01 00 00 00 00 00 00 00 序列化头,经过实践分析,这部分基本在每个序列化后的数据都一样,下面也可以看到与其他的一样
2 )0C 02 被序列化后对象描述信息的表示符
3 )00 00 00 51(81)长度,(注意是大端的4位整型),说明后面对象描述信息的长度
4 )自定义对象的描述信息,分析时可以忽略,长度为81个字符(前一项以说明)
5 )05 01自定义对象的表示符 .
6 )00 00 00 1b (27)自定义对象类描述信息的长度
7 )自定义对象的描述信息,主要类的符号表示 (“WindowsApplication2.Object5”)
8 )自定义对象中的成员条目,例如在上面定义的对象中有四项,分别为int、int、flaot和string
9 )02 长度为2的int i1成员
10 )对应成员名称的定义标示 “i1”
11 )同9项
12 )同10项
13 )同 9项
14 )同 10项
15 )同 9项
16 )同10项
17 )说明自定义对象的各个定义项目是值对象还是其他类型,一共4个字节,00为值对象
01为字符对象 在上面定义的对象为 int i1 int i2 float f1 string str 对应为 00 00 00 01 。
18)说明17)对应的字段的类型 分别为 int 08 int 08 int 0b
19) 02 00 00 00 固定,说明其他数据的开始
20)对应obj.i1的值 80 00 00 00(128、小端格式)
21)对应obj.i2的值 18 00 00 00 (24、小端格式)
22)对应obj.f1的值 66 66 a6 3f (1.3的浮点格式)
23)06 03 对象string标示符,说明它是string对象
24、25)00 00 00 0b string对象的长度11(大端),值为“Some String”
26)0b表示一个对象序列的结束。
27)同1)
28)04 01 double类型的表示符号
29)00 00 00 0d(13) 类型长度(大端)
30)对象定义标示符( “System.Double”)
31) 01 00 00 00(1)包含一个成员
32)07 (7)成员的定义标示符长度
33) 成员的定义符号 “m_value”
34) 00 说明是值类型 06说明是double类型
35)CD CC CC CC CC CC F4 3F double类型对应的数值
36)0b一个序列对象的结束
其他的注释分析就在这里不在重复了,原理都一样的!
经过测试得到的类型与表示符的部分对应关系,如下所示
bool 01
byte 02
uint 0f
char 03
ulong 10
ushort 0e
decimal 05
int 08
sbyte 0a
short 07
double 06
float 0b
long 09
string 06 03 \06 04
值类型 00
string 01
object 02
[] 07
struct 04
这里分析只是一部份!主要随着对象的复杂,会涌现出没有分析到的标示符,如果你发现新的请给我发一封电子邮件,万分感谢!
这时大家也可以体会出为什么xml序列化的存在了,不同系统实现数据想要容易的多了,但xml有一个缺点就是数据量大.这是与二进制序列化所不能比的!
Xml序列化代码如下:
System.Xml.Serialization.XmlSerializer formatter=new System.Xml.Serialization.XmlSerializer(obj.GetType());
对象Object5序列化后的xml文件如下:
<?xml version="1.0"?>
<Object5 xmlns:xsd="http://www.w3.org/2001/XMLSchema" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance">
<i1>128</i1>
<i2>24</i2>
<f3>1.3</f3>
<str>Some String</str>
</Object5>
简单吧!