golang数据传输格式-序列化与反序列化

                  golang数据传输格式-序列化与反序列化

                                          作者:尹正杰

版权声明:原创作品,谢绝转载!否则将追究法律责任。

 

 

  想必计算机专业毕业的小伙伴应该都知道数据想要持久化存储,必须将其存在I/O设备里面,这些I/O设备可以是光盘,U盘,机械硬盘,移动硬盘等等。那么这些数据是以哪种方式进程存取的呢?这就是我们聊的数据传输格式。

  数据格式(data format)是描述数据保存在文件记录中的规则。可以是字符形式的文本格式,或二进制数据形式的压缩格式。字符形式的文本格式占用的存贮空间多但透明度高,二进制数形式的压缩格式占用的存贮空间少但缺少透明度。数据结构是计算机存储、组织数据的方式。数据结构是指相互之间存在一种或多种特定关系的数据元素的集合。通常情况下,精心选择的数据结构可以带来更高的运行或者存储效率

  数据结构往往同高效的检索算法索引技术有关。[1] 数据结构要在网络中传输或保存到文件,就必须对其编码和解码;目前存在很多编码格式:JSON,XML,gob,Google 缓冲协议等等。Go 语言支持所有这些编码格式。不过本篇博客将讨论前三种格式。

  

 

一.XML

  XML作为一种数据交换和信息传递的格式已经十分普及。而随着 Web服务日益广泛的应用,现在XML在日常的开发工作中也扮演了愈发重要的角色。如同 json 包一样,也有 Marshal() 和 UnMarshal() 从 XML 中编码和解码数据;但这个更通用,可以从文件中读取和写入(或者任何实现了 io.Reader 和 io.Writer 接口的类型)和 JSON 的方式一样,XML 数据可以序列化为结构,或者从结构反序列化为 XML 数据;

  接下来我们将对“yinzhengjie.xml”文件进行反序列化,其文件内容如下:

1 <?xml version="1.0" encoding="UTF-8"?>      <!--第一行是 XML 声明。它定义 XML 的版本 (1.0) 和所使用的"UTF-8"编码。-->
2 <UserInformation>                   <!--第一行描述文档的根元素(像在说:“本文档是记录用户信息的”):-->
3     <string age="18">yinzhengjie</string>   <!--本行和以下两行都是跟的子元素,当然你可以给它嵌套更多的子子孙孙。注意,这里的标签名称是“string”,这个标签名称你也可以自己随意更改的哟!-->
4     <string age="20">尹正杰</string>
5 </UserInformation>                <!--最后一行定义根元素的结尾-->

1.Xml数据格式的反序列化

 1 /*
 2 #!/usr/bin/env gorun
 3 @author :yinzhengjie
 4 Blog:http://www.cnblogs.com/yinzhengjie/tag/GO%E8%AF%AD%E8%A8%80%E7%9A%84%E8%BF%9B%E9%98%B6%E4%B9%8B%E8%B7%AF/
 5 EMAIL:y1053419035@qq.com
 6 */
 7 
 8 package main
 9 
10 import (
11     "encoding/xml"
12     "io/ioutil"
13     "log"
14     "fmt"
15 )
16 
17 var (
18     InputFile = "E:\\Code\\Golang\\Golang_Program\\数据格式进阶\\yinzhengjie.xml"
19 )
20 
21 
22 type RootElement struct {                                            //这是定义根元素的,我们需要做的就是讲XML数据的结构先定义出来,就是为了方便主函数一会直接通过这个结构去读取数据。
23     XMLName        xml.Name         `xml:"UserInformation"`     //这个我们指定XML的根元素,我们也可以叫它最外层标签。
24     ResourceString []ChildElement `xml:"string"`                //上面是指定父标签的话,这个应该就不用多做解释吧,当然是子标签了啦。如果你的子表情有多个属性的,或是有多个同类型的标签的话,就可以用切片来存储。
25 }
26 
27 type ChildElement struct {                    //这个结构体是定义子元素的结构的。
28     XMLName    xml.Name `xml:"string"`        //注意,这里是我们的子元素的一级标签,因此该标签的名称必须填写正确,不然反序列化的时候就会报错。
29     StringName string   `xml:"age,attr"`        //这个是定义,一级标签的属性的,我们需要用attr来进行表示,于此同时,我们还需要输入属性的关键字“age”
30     InnerText  string   `xml:",innerxml"`            //这行就是定义标签里面的具体内容经的,对了,其中关键字“,innerxml”里的逗号不要忘记哟。
31 }
32 
33 func main() {
34     GolangXml, err := ioutil.ReadFile(InputFile)    //我们把数据一次性读取到一个切片中。
35     if err != nil {
36         log.Fatal(err)
37     }
38 
39     var result RootElement
40     fmt.Printf("序列化之前GolangXml = [%v]\n",result)
41     err = xml.Unmarshal(GolangXml, &result)            //然后对数据进行反序列化。
42     if err != nil {
43         log.Fatal(err)
44     }
45     fmt.Printf("序列化之后GolangXml = [%v]\n",result)
46     fmt.Println(result.ResourceString)
47 }
48 
49 
50 
51 #以上代码执行结果如下:
52 序列化之前GolangXml = [{{ } []}]
53 序列化之后GolangXml = [{{ UserInformation} [{{ string} 18 yinzhengjie} {{ string} 20 尹正杰}]}]
54 [{{ string} 18 yinzhengjie} {{ string} 20 尹正杰}]

2.Xml数据格式的序列化

 1 /*
 2 #!/usr/bin/env gorun
 3 @author :yinzhengjie
 4 Blog:http://www.cnblogs.com/yinzhengjie/tag/GO%E8%AF%AD%E8%A8%80%E7%9A%84%E8%BF%9B%E9%98%B6%E4%B9%8B%E8%B7%AF/
 5 EMAIL:y1053419035@qq.com
 6 */
 7 
 8 package main
 9 
10 import (
11     "encoding/xml"
12     "io/ioutil"
13     "log"
14     "fmt"
15     "strings"
16     "os"
17 )
18 
19 var (
20     InputFile = "E:\\Code\\Golang\\Golang_Program\\数据格式进阶\\yinzhengjie.xml"
21     OutputFile = "E:\\Code\\Golang\\Golang_Program\\数据格式进阶\\yinzhengjie.xml.bak"
22 )
23 
24 
25 type RootElement struct {                                            //这是定义根元素的,我们需要做的就是讲XML数据的结构先定义出来,就是为了方便主函数一会直接通过这个结构去读取数据。
26     XMLName        xml.Name         `xml:"UserInformation"`     //这个我们指定XML的根元素,我们也可以叫它最外层标签。
27     ResourceString []ChildElement `xml:"string"`                //上面是指定父标签的话,这个应该就不用多做解释吧,当然是子标签了啦。如果你的子表情有多个属性的,或是有多个同类型的标签的话,就可以用切片来存储。
28 }
29 
30 type ChildElement struct {                    //这个结构体是定义子元素的结构的。
31     XMLName    xml.Name `xml:"string"`        //注意,这里是我们的子元素的一级标签,因此该标签的名称必须填写正确,不然反序列化的时候就会报错。
32     StringName string   `xml:"age,attr"`        //这个是定义,一级标签的属性的,我们需要用attr来进行表示,于此同时,我们还需要输入属性的关键字“age”
33     InnerText  string   `xml:",innerxml"`            //这行就是定义标签里面的具体内容经的,对了,其中关键字“,innerxml”里的逗号不要忘记哟。
34 }
35 
36 func main() {
37     GolangXml, err := ioutil.ReadFile(InputFile)    //我们把数据一次性读取到一个切片中。
38     if err != nil {
39         log.Fatal(err)
40     }
41 
42     var result RootElement
43     err = xml.Unmarshal(GolangXml, &result)            //然后对数据进行反序列化。
44     if err != nil {
45         log.Fatal(err)
46     }
47     for key,value := range result.ResourceString{
48         if strings.EqualFold(value.StringName,"18") {  //只修改属性值为"18"节点的内部文本innerText
49             result.ResourceString[key].InnerText = "666666666666666"    //注意修改的不是value对象,而是直接使用result中的真实对象
50             fmt.Println("内容修改完毕!")
51         }
52     }
53     XmlOutput,err := xml.MarshalIndent(result,"","")    //保存修改后的内容
54     if err == nil {
55         HeaderBytes := []byte(xml.Header)                          //加入XML头信息
56         XmlData := append(HeaderBytes,XmlOutput...)                //拼接XML头和实际XML内容
57         ioutil.WriteFile(OutputFile,XmlData,os.ModeAppend)        //写入文件
58         fmt.Println(string(XmlData))
59         fmt.Println("文件写入成功!")
60     }else {
61         fmt.Println(err)
62     }
63 }
64 
65 
66 
67 #以上代码执行结果如下:
68 内容修改完毕!
69 <?xml version="1.0" encoding="UTF-8"?>
70 <UserInformation><string age="18">666666666666666</string><string age="20">尹正杰</string></UserInformation>
71 文件写入成功!

  执行以上代码之后,会生成一个新的文件,即“yinzhengjie.xml.bak”文件。其内容如下:

1 <?xml version="1.0" encoding="UTF-8"?>
2 <UserInformation><string age="18">666666666666666</string><string age="20">尹正杰</string></UserInformation>

  更多关于学习XML知识的话,我推荐两个学习的网站给大家:

      a>.http://www.xml.org/

      b>.http://www.w3school.com.cn/xml/

 

二.JSON

  JSON(JavaScript Object Notation)是一种轻量级的数据交换格式。人类阅读和写作很容易。机器解析和生成很容易。它基于JavaScript编程语言的一个子集 , 标准ECMA-262第3版 - 1999年12月。JSON是完全独立于语言的文本格式,但是使用C语言家族的程序员熟悉的约定,包括C,C ++,C#,Java,JavaScript,Perl,Python等等。这些属性使JSON成为理想的数据交换语言。

1.Json数据格式的序列化

   在golang语言中,我们用json.Marshal() 进行序列化。json.Marshal() 的函数签名是 func Marshal(v interface{}) ([]byte, error)。出于安全考虑,在 web 应用中最好使用 json.MarshalforHTML() 函数,其对数据执行HTML转码,所以文本可以被安全地嵌在 HTML <script> 标签中。序列化是在内存中把数据转换成指定格式(data -> string),反之亦然(string -> data structure)编码也是一样的,只是输出一个数据流(实现了 io.Writer 接口);解码是从一个数据流(实现了io.Reader)输出到一个数据结构。

  JSON 与 Go 类型对应如下:

    a>.bool 对应 JSON 的 booleans;
    b>.float64 对应 JSON 的 numbers;
      c>.string 对应 JSON 的 strings;
      d>.nil 对应 JSON 的 null;

  不是所有的数据都可以编码为 JSON 类型:只有验证通过的数据结构才能被编码:
    a>.JSON 对象只支持字符串类型的 key;要编码一个 Go map 类型,map 必须是 map[string]T(T是json 包中支持的任何类型);
    b>.Channel,复杂类型和函数类型不能被编码;
    c>.不支持循环数据结构;它将引起序列化进入一个无限循环;
    d>.指针可以被编码,实际上是对指针指向的值进行编码(或者指针是 nil);

  Go 语言的 json 包可以让你在程序中方便的读取和写入 JSON 数据。接下来我们一起看一下golang是如何使用json包的:

 1 /*
 2 #!/usr/bin/env gorun
 3 @author :yinzhengjie
 4 Blog:http://www.cnblogs.com/yinzhengjie/tag/GO%E8%AF%AD%E8%A8%80%E7%9A%84%E8%BF%9B%E9%98%B6%E4%B9%8B%E8%B7%AF/
 5 EMAIL:y1053419035@qq.com
 6 */
 7 
 8 package main
 9 
10 import (
11     "encoding/json"
12     "fmt"
13     "log"
14     "os"
15 )
16 
17 var (
18     OutputFile = "E:\\Code\\Golang\\Golang_Program\\数据格式进阶\\yinzhengjie.json"
19 )
20 
21 type TenScenicSpots struct {    //定义10个景区的名称。
22     FirstScenic string
23     SecondScenic string
24     ThirdScenic string
25     FourthScenic string
26     FifrhScenic    string
27     SixthScenic string
28     SeventhScenic string
29     EigthtScenic string
30     NinthScenic string
31     TenthScenic string
32 }
33 
34 type TouristInformation struct {    //定义游客信息
35     VisitorName string                //游客姓名
36     Nationality string                //游客国籍
37     City string                        //想要去的城市
38     ScenicSpot []*TenScenicSpots    //想要去看的景区
39 
40 }
41 
42 func main() {
43     ChaoyangDistrict := &TenScenicSpots{"中华名族园","北京奥林匹克公园","国家体育馆","中国科学技术官","奥林匹克公园网球场","蟹岛绿色生态农庄","国家游泳中心(水立方)","中国紫檀博物馆","北京欢乐谷","元大都城"}
44     DaxingDistrict := &TenScenicSpots{ "北京野生动物园","男孩子麋鹿苑","中华文化园","留民营生态农场","中国印刷博物馆","北普陀影视城","大兴滨河森林公园","呀路古热带植物园","庞各庄万亩梨园","西黄垈村"}
45     District := TouristInformation{"尹正杰", "中国", "北京", []*TenScenicSpots{ChaoyangDistrict, DaxingDistrict}}
46     GolangJson, err := json.Marshal(District) //这个步骤就是序列化的过程。json.Marshal方法会返回一个字节数组,即GolangJson,与此同时,District已经是JSON格式的啦。
47     if err != nil {
48         log.Fatal("序列化报错是:%s",err)
49     }
50     fmt.Printf("JSON format: %s", GolangJson)
51 
52     file, _ := os.OpenFile(OutputFile, os.O_CREATE|os.O_WRONLY, 0)
53     defer file.Close()
54     Write := json.NewEncoder(file)  //创建一个编码器。
55     err = Write.Encode(District)    //由于District已经被json.Marshal方法处理过了,所以我们直接把JSON格式的District传给Write写入器,调用该写入器的Encode方法可以对JSON格式的数据进行编码。如果顺利的话,我们会得到一个nil参数,否则我们会得到编码的错误信息。
56     if err != nil {
57         log.Println("Error in encoding json")
58     }
59 }
60 
61 
62 
63 
64 #以上代码执行结果如下:
65 JSON format: {"VisitorName":"尹正杰","Nationality":"中国","City":"北京","ScenicSpot":[{"FirstScenic":"中华名族园","SecondScenic":"北京奥林匹克公园","ThirdScenic":"国家体育馆","FourthScenic":"中国科学技术官","FifrhScenic":"奥林匹克公园网球场","SixthScenic":"蟹岛绿色生态农庄","SeventhScenic":"国家游泳中心(水立方)","EigthtScenic":"中国紫檀博物馆","NinthScenic":"北京欢乐谷","TenthScenic":"元大都城"},{"FirstScenic":"北京野生动物园","SecondScenic":"男孩子麋鹿苑","ThirdScenic":"中华文化园","FourthScenic":"留民营生态农场","FifrhScenic":"中国印刷博物馆","SixthScenic":"北普陀影视城","SeventhScenic":"大兴滨河森林公园","EigthtScenic":"呀路古热带植物园","NinthScenic":"庞各庄万亩梨园","TenthScenic":"西黄垈村"}]}

2.Json数据格式的反序列化    

   如果我们事先知道 JSON 数据,我们可以定义一个适当的结构并对 JSON 数据反序列化。我们上面做序列化的时候创建了一个“yinzhengjie.json”的文件,里面的数据结果我们是心知肚明的,因此,接下来反序列化就是一件很Easy的事情啦。

 1 /*
 2 #!/usr/bin/env gorun
 3 @author :yinzhengjie
 4 Blog:http://www.cnblogs.com/yinzhengjie/tag/GO%E8%AF%AD%E8%A8%80%E7%9A%84%E8%BF%9B%E9%98%B6%E4%B9%8B%E8%B7%AF/
 5 EMAIL:y1053419035@qq.com
 6 */
 7 
 8 package main
 9 
10 
11 import (
12     "encoding/json"
13     "fmt"
14     "log"
15     "io/ioutil"
16 )
17 
18 var (
19     InputFile = "E:\\Code\\Golang\\Golang_Program\\数据格式进阶\\yinzhengjie.json"
20 )
21 
22 type TenScenicSpots struct {    //定义10个景区的名称。
23     FirstScenic string
24     SecondScenic string
25     ThirdScenic string
26     FourthScenic string
27     FifrhScenic    string
28     SixthScenic string
29     SeventhScenic string
30     EigthtScenic string
31     NinthScenic string
32     TenthScenic string
33 }
34 
35 type TouristInformation struct {    //定义游客信息
36     VisitorName string                //游客姓名
37     Nationality string                //游客国籍
38     City string                        //想要去的城市
39     ScenicSpot []*TenScenicSpots    //想要去看的景区
40 
41 }
42 
43 func main() {
44     var GolangJson   TouristInformation        //定义反序列化JSON的格式
45 
46     file,err := ioutil.ReadFile(InputFile)  //得到的文件是一个字节切片哟
47     if err != nil {
48         log.Println(err)
49     }
50     
51     err = json.Unmarshal(file,&GolangJson)  //将得到的字节进行反序列化
52     if err != nil {
53         log.Fatal("反序列化报错啦:%s",err)
54     }
55 
56     fmt.Printf("JSON format: %v\n", GolangJson) //将反序列化的文件打印出来。
57     fmt.Println(GolangJson.City)
58     fmt.Println(GolangJson.ScenicSpot[1])
59 }
60 
61 
62 
63 #以上代码执行结果如下:
64 JSON format: {尹正杰 中国 北京 [0xc042050140 0xc042050280]}
65 北京
66 &{北京野生动物园 男孩子麋鹿苑 中华文化园 留民营生态农场 中国印刷博物馆 北普陀影视城 大兴滨河森林公园 呀路古热带植物园 庞各庄万亩梨园 西黄垈村}

  更多关于学习XML知识的话,我推荐两个学习的网站给大家:

      a>.http://www.json.org/

      b>.http://www.w3school.com.cn/json/

 

三.Gob

  Gob 是 Go 自己的以二进制形式序列化和反序列化程序数据的格式;可以在 encoding 包中找到。这种格式的数据简称为 Gob (即 Go binary 的缩写)。类似于 Python 的 "pickle" 和 Java 的"Serialization"。

  Gob 通常用于远程方法调用参数和结果的传输,以及应用程序和机器之间的数据传输。 它和 JSON 或 XML 有什么不同呢?Gob 特定地用于纯 Go 的环境中,例如,两个用 Go 写的服务之间的通信。这样的话服务可以被实现得更加高效和优化。 Gob 不是可外部定义,语言无关的编码方式。因此它的首选格式是二进制,而不是像 JSON 和 XML 那样的文本格式。 Gob 并不是一种不同于Go 的语言,而是在编码和解码过程中用到了 Go 的反射。

  Gob 文件或流是完全自描述的:里面包含的所有类型都有一个对应的描述,并且总是可以用 Go 解码,而不需要了解文件的内容。

  只有可导出的字段会被编码,零值会被忽略。在解码结构体的时候,只有同时匹配名称和可兼容类型的字段才会被解码。当源数据类型增加新字段后,Gob 解码客户端仍然可以以这种方式正常工作:解码客户端会继续识别以前存在的字段。并且还提供了很大的灵活性,比如在发送者看来,整数被编码成没有固定长度的可变长度,而忽略具体的 Go 类型。

   Golang的解码和编码就相对简单啦,就我个人而言,我对golang专有的gob格式还是那么的情有独钟。它的使用方法很简单,我们可以一起看一下它的解码和编码的过程,具体代码 如下:

1.Gob的编码(序列化)

 1 /*
 2 #!/usr/bin/env gorun
 3 @author :yinzhengjie
 4 Blog:http://www.cnblogs.com/yinzhengjie/tag/GO%E8%AF%AD%E8%A8%80%E7%9A%84%E8%BF%9B%E9%98%B6%E4%B9%8B%E8%B7%AF/
 5 EMAIL:y1053419035@qq.com
 6 */
 7 
 8 package main
 9 
10 import (
11     "bytes"
12     "encoding/gob"
13     "log"
14     "io/ioutil"
15 )
16 
17 var (
18     OutputFile = "E:\\Code\\Golang\\Golang_Program\\数据格式进阶\\yinzhengjie.gob"
19 )
20 
21 type P struct {
22     X, Y, Z int
23     Name    string
24 }
25 
26 func main() {
27     var GolngGob bytes.Buffer
28 
29     enc := gob.NewEncoder(&GolngGob) //生成一个的编码器
30 
31     yzj := P{100, 200, 300, "Yinzhengjie"}
32     err := enc.Encode(yzj)    //编码结构体和数据
33     if err != nil {
34         log.Fatal("encode error:", err)
35     }
36     ioutil.WriteFile(OutputFile, GolngGob.Bytes(), 0644)        //我们把编码后的数据写入文件
37 }

  执行以上代码之后会生成一个“yinzhengjie.gob”文件,这个文件的内容是二进制编码的,因此我们用gbk编码或是utf-8编码格式直接去打开的话可能不是很理想。因此我们可以通过gob的反序列化来进行读取操作,具体代码请参考以下代码。

2.Gob的解码(反序列化)

 1 /*
 2 #!/usr/bin/env gorun
 3 @author :yinzhengjie
 4 Blog:http://www.cnblogs.com/yinzhengjie/tag/GO%E8%AF%AD%E8%A8%80%E7%9A%84%E8%BF%9B%E9%98%B6%E4%B9%8B%E8%B7%AF/
 5 EMAIL:y1053419035@qq.com
 6 */
 7 
 8 package main
 9 
10 import (
11     "encoding/gob"
12     "log"
13     "os"
14     "fmt"
15 )
16 
17 var (
18     InputFile = "E:\\Code\\Golang\\Golang_Program\\数据格式进阶\\yinzhengjie.gob"
19 )
20 
21 type P struct {
22     X, Y, Z int
23     Name    string
24 }
25 
26 type Q struct {
27     X, Y,Z*int32
28     Name string
29 }
30 
31 func main() {
32     file,err := os.Open(InputFile)
33     dec := gob.NewDecoder(file)        //生成一个解码器
34 
35     var GolangGob Q
36     fmt.Printf("解码前GolangGob的内容为[%v]\n",GolangGob)
37     err = dec.Decode(&GolangGob)    //开始按照我们定义好的GolangGob结构体开始解码。
38     if err != nil {
39         log.Fatal("decode error:", err)
40     }
41     fmt.Printf("解码后GolangGob的内容为[%v]\n",GolangGob)
42 
43     fmt.Printf("详细内容为:【%d,%d,%d,%q】\n", *GolangGob.X, *GolangGob.Y, *GolangGob.Z, GolangGob.Name)    //注意传参的顺序哟!
44 }
45 
46 
47 
48 #以上代码执行结果如下:
49 解码前GolangGob的内容为[{<nil> <nil> <nil> }]
50 解码后GolangGob的内容为[{0xc04203c838 0xc04203c83c 0xc04203c840 Yinzhengjie}]
51 详细内容为:【100,200,300,"Yinzhengjie"

 

四.数据传输进阶知识-golang中的密码学

 通过网络传输的数据必须加密,以防止被 hacker(黑客)读取或篡改,并且保证发出的数据和收到的数据检验和一致。 鉴于 Go 母公司的业务,我们毫不惊讶地看到 Go 的标准库为该领域提供了超过 30 个包:

  1>.hash 包:实现了 adler32 、 crc32 、 crc64 和 fnv 校验;

  2>.crypto 包:实现了其它的 hash 算法,比如 md4 、 md5 、 sha1 等。以及完整地实现了 aes 、blowfish 、 rc4 、 rsa 、 xtea 等加密算法。

  想要了解更多关于golang加密方法的可以参考:http://www.cnblogs.com/yinzhengjie/p/7368030.html

 

posted @ 2017-11-09 00:32  尹正杰  阅读(6529)  评论(0编辑  收藏  举报