python爬虫信息标记/xml/json/yaml

信息标记的三种形式

1、XML:扩展标记语言,以标签为主构建信息、表达信息的方式。

      最早的信息标记语言,可扩展性好,但繁琐

      主要用于Internet上的信息交互和传递

  1.1、形式:

    <img src="china.jpg" size="10"> ...</img>

    <img src="china.jpg" size="10" />   空元素的缩写形式

    <!-- This is a comment, very useful -->  注释以“<!”开头,以“>”结尾表示

    <tag:attribute>...</tag>

2、JSON:有类型的键值对

     适合程序处理(js),

     移动应用云端和节点的信息通信,用于程序对接口处理

     无注释。

  2.1、形式

    key:value

    "name":"工程小白"

    "name":["newName","oldName"]

    "name":{"newName":"first","oldname":"second"}

3、YAML:无类型键值对

      各类系统的配置文件,有注释,易读。

  3.1、形式

    name:工程小白

    用“-”表达并列关系

      language:

        -python

        -java

        -c语言

    用“|”表达整块数据  #表示注释

      text:|     #this is a command

      text所指的数据、内容。。。。。。。。。。。。。。。

      。。。。。。。。。。。。。。。

 

posted @ 2019-01-29 10:28  小小白爱学习~  阅读(230)  评论(0编辑  收藏  举报