Python爬虫:信息标记

HTML

hyper text markup language。超文本标记语言。是WWW的信息组织方式,能将声音、图像、视频等超文本信息嵌入到文本中。
HTML通过预定义的<>...</>标签形式组织不同类型的信息。

信息标记的三种形式

XML

eXtensible Markup Language。扩展标记语言,是一种与HTML很接近的标记语言。
以标签为主来构建信息、表达信息。

JSON

JavaScript Object Notation。是js语言中对面向对象信息的一种表达形式。
JSON是指有数据类型的键值对key:value构建的信息表达方式。



YAML

YAML Ain't Markup Language。
无类型的键值对key:value。没有双引号;通过缩进表达所属关系;通过-号表达并列关系。




三种语言的比较


posted @ 2022-05-19 10:51  孤舟浮岸  阅读(53)  评论(0编辑  收藏  举报