python爬虫信息标记/xml/json/yaml
信息标记的三种形式
1、XML:扩展标记语言,以标签为主构建信息、表达信息的方式。
最早的信息标记语言,可扩展性好,但繁琐
主要用于Internet上的信息交互和传递
1.1、形式:
<img src="china.jpg" size="10"> ...</img>
<img src="china.jpg" size="10" /> 空元素的缩写形式
<!-- This is a comment, very useful --> 注释以“<!”开头,以“>”结尾表示
<tag:attribute>...</tag>
2、JSON:有类型的键值对
适合程序处理(js),
移动应用云端和节点的信息通信,用于程序对接口处理
无注释。
2.1、形式
key:value
"name":"工程小白"
"name":["newName","oldName"]
"name":{"newName":"first","oldname":"second"}
3、YAML:无类型键值对
各类系统的配置文件,有注释,易读。
3.1、形式
name:工程小白
用“-”表达并列关系
language:
-python
-java
-c语言
用“|”表达整块数据 #表示注释
text:| #this is a command
text所指的数据、内容。。。。。。。。。。。。。。。
。。。。。。。。。。。。。。。