.Net1.0和2.0下 soap序列化和binary序列化对比(转载)

 

binary 方式要比soap快,体积小;vs20052003块,下边是详细的数据比较(序列化了一个比较大的对象)


1:在vs2003下,binary方式的速度快一倍,体积小7

Vs2003

 

Size (体积)

Serializer(序列化)

Deserializer(反序列化)

binary

915k

4750ms

9453ms

soap

6737k

10625ms

25187ms

比率

17

12

12

 

2:在vs2005种,binary方式速度快4-7倍,体积小7

Vs2005

 

Size (体积)

Serializer(序列化)

Deserializer(反序列化

binary

921k

1046ms

948ms

soap

6775k

5078ms

6812ms

比率

17

14

17

 

然后横向比较

3binary方式在20032005种体积不变,速度快4-10

binary

 

Size (体积)

Serializer(序列化)

Deserializer(反序列化

2003

915k

4750ms

9453ms

2005

921k

1046ms

948ms

比率

11

41

101

4soap方式在20032005下体积不变,速度快2-4

soap

 

Size (体积)

Serializer(序列化)

Deserializer(反序列化

2003

6737k

10625ms

25187ms

2005

6775k

5078ms

6812ms

比率

11

21

41

 

结论:

使用bin方式可以缩短时间2倍以上,体积减少7倍多

Vs2005缩短了序列化时间,bin可达10倍;体积不变

 

其他
bin
方式不能跨平台,soap可以


下面是从“WEB SERVICE 上返回大数据量的DATASET”应用实例

众所周知,如果不用其它方法,直接从WEB SERVICE上传回一个10W条记录的DATASET,可想而知的后果是什么,CPU要占用 100%,且要等上几分钟,这是任何一个项目都无法忍受的.在我上网找资料的过程中,试验了几种不同的方法,通过压缩SOAP改善XML Web service性能,这篇文章所介绍的方法用了SOAP扩展,是通过在WEB SERVICE端用已经过时了的NZIPLIB库来压缩SOAP响应,据称文本压缩率可达80%.文章里面的代码是VB.NET,费了好大劲翻译成C#,照上面建项目,但是很可惜,我没有编译成功,总是出错.
这里我找我建好的项目提供大家下载,大家有时间看看是什么问题.
SOAP压缩代码下载
      
而后,找到了用序列化的方式来减少网络传输量,Microsoft .NET Framework 1.x 中内建两种将物件序列化的 Formatter类别,SoapFormatter BinaryFormatter,两种方式均能减轻网络传输量提高性能,SoapFormatter方式传输的方式其实还是XML形式,加了很多XML标识,因此压缩率不是很理想,BinaryFormatter用纯二进制的方式序列化DATASET,能使压缩率大大提高,这是台湾作者李匡正 (台灣微軟應用架構技術經理提供的例子里对SQL范例库Northwind的测试结果:

 

SoapFormatter 

BinaryFormatter 

Dataset 序列化後 Bytes 數 

1,953,078

1,448,399 

很显示然BinaryFormatter 明显优于SoapFormatter ,而我也确实用了BinaryFormatter 这种方式实现了提高效率.
再者,用微软提供的DataSetSurrogate 类可以此基础上进一步压缩数据大小,DataSetSurrogate 在.net 2.0里自带。这是比较结果.

  SoapFormatter BinaryFormatter
Dataset 序列化後Bytes數 1,953,078 1,448,399
DataSetSurrogate 序列化後Bytes數 2,371,942 575,684


在这里,有两种方式:可把序列化后的数据用文件形式保存在客户端硬盘;也可用Byte[]方式传回客户端,以下是代码。
web service 端(文件形式)
客户端
web service 端(Byte[]方式)
客户端
   
 

 

  [WebMethod(Description="循环获取远程DATASET")]
  
public void SurrogateReadTable(string TableName)
  
{
   
//把DataSet通过Surrogate Class 序列化成 Binary Stream
  
   DataSet ds;
   ds
=SqlHelper.ExecuteDataset(cnn,CommandType.Text,"select * from "+TableName);
   
//实例化DataSetSurrogate,传取出的DATASET到构造函数里
   sds = new DataSetSurrogate(ds); 
   
//实例化二进制流
   BinaryFormatter bf=new BinaryFormatter();
   StreamWriter swDat; 
   
//写到本地一个文件里
   swDat = new StreamWriter(@"c:\output_surrogate_dataset.dat");
   bf.Serialize(swDat.BaseStream, sds);
   
//这里可以知道序列化后的文件的大小
   long size = swDat.BaseStream.Length;
   swDat.Close();
  
  }

 

 

private void button1_Click(object sender, System.EventArgs e)
  
{
   label1.Text
=DateTime.Now.ToString();

   button1.Enabled
=false;
   
//反序列化Binary Stream能通过Surrogate Class转换成 DataSet

   
//从WEB SERVICE上读取方法
   svs.SurrogateRead("t_busdocbase");
   BinaryFormatter bf
=new BinaryFormatter();
   StreamReader swDat; 
   swDat 
= new StreamReader(@"c:\output_surrogate_dataset.dat");
   
object o=bf.Deserialize(swDat.BaseStream);
  DataSet ds;
   sds 
= (DataSetSurrogate) o;
   ds 
= sds.ConvertToDataSet();
   dataGrid1.DataSource
=ds.Tables[0];
   swDat.Close();
   }



 

[WebMethod(Description="获取业务资料远程DATASET")]
      
public byte[] SurrogateRead1()
      
{
       DataSet ds;
       ds
=SqlHelper.ExecuteDataset(cnn,CommandType.Text,"select * from t_busdocbase");
       sds 
= new DataSetSurrogate(ds); 
       MemoryStream s
= new MemoryStream();
       BinaryFormatter bf 
= new BinaryFormatter();
       bf.Serialize(s,sds);
     
       
byte[] e = s.ToArray();
       
return e; 
  
      }

 

private void button3_Click(object sender, System.EventArgs e)
   
{
    label1.Text
=DateTime.Now.ToString();

    button3.Enabled
=false;
    
//*反序列化Binary Stream能通过Surrogate Class转换成 DataSet*/

    
//从WEB SERVICE上读取方法


     
byte [] bb=svs.SurrogateRead1();
     MemoryStream br
=new MemoryStream(bb);
     BinaryFormatter bf
=new BinaryFormatter();
     
object o=bf.Deserialize(br);
     sds 
= (DataSetSurrogate) o;
     ds 
= sds.ConvertToDataSet(); 
     dataGrid1.DataSource
=ds.Tables[0];

     br.Close();

    }



 



我个人觉得用byte[]方式会安全些,毕竟不用在客户端产生文件,不用担心数据的安全。

当然作为从网络上读取数据来说,10W条是一个不小量,所有的方式包括压缩,序列化等都是权宜之计,而不是长久之计,在使用当中,我用以上的方法虽然能使网络传输量降低,且可在很短时间内就把数据显示在DATAGRID上,但CPU的开销却达到了100%,这是我一直头疼的。我后来又用了分页的方式,把10W条数据在服务器端就分批取出,每次500条,这样读取时间延长了,但CPU开销却未减轻很多,再后来,又用多线程的方式处理,不甚理想。因此最好的方法就是尽可能的不查询10W条数据,通过条件判断等方式减少所需处理的数据量。

posted @ 2008-06-12 19:06  痞子刘  阅读(483)  评论(1编辑  收藏  举报