Python爬虫:信息标记
HTML
hyper text markup language。超文本标记语言。是WWW的信息组织方式,能将声音、图像、视频等超文本信息嵌入到文本中。
HTML通过预定义的<>...</>标签形式组织不同类型的信息。
信息标记的三种形式
XML
eXtensible Markup Language。扩展标记语言,是一种与HTML很接近的标记语言。
以标签为主来构建信息、表达信息。
JSON
JavaScript Object Notation。是js语言中对面向对象信息的一种表达形式。
JSON是指有数据类型的键值对key:value构建的信息表达方式。
YAML
YAML Ain't Markup Language。
无类型的键值对key:value。没有双引号;通过缩进表达所属关系;通过-号表达并列关系。
三种语言的比较
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· TypeScript + Deepseek 打造卜卦网站:技术与玄学的结合
· .NET Core 中如何实现缓存的预热?
· 阿里巴巴 QwQ-32B真的超越了 DeepSeek R-1吗?
· 如何调用 DeepSeek 的自然语言处理 API 接口并集成到在线客服系统
· 【译】Visual Studio 中新的强大生产力特性