[爬虫]1.2.1 HTML标签和属性
HTML(HyperText Markup Language)是一种用于创建网页的标记语言。HTML文档由一系列的HTML标签构成,每个标签都有自己的意义和用途。HTML标签通常成对出现,由一个开始标签和一个结束标签组成,结束标签的名称前有一个斜杠。
例如,<p>
是一个段落标签的开始,</p>
是一个段落标签的结束。在这两个标签之间的内容是一个段落。
<p>这是一个段落。</p>
常见的HTML标签
以下是一些常见的HTML标签:
<h1>
到<h6>
:定义标题,<h1>
是最大的标题,<h6>
是最小的标题。<p>
:定义段落。<a>
:定义超链接。<img>
:定义图像。<ul>
:定义无序列表。<ol>
:定义有序列表。<li>
:定义列表项目。<div>
:定义文档中的区段(division/section)。<span>
:定义文# HTML标签和属性
HTML(HyperText Markup Language)是一种用于创建网页的标记语言。HTML文档由一系列的HTML标签构成,每个标签都有自己的意义和用途。HTML标签通常成对出现,由一个开始标签和一个结束标签组成,结束标签的名称前有一个斜杠。
例如,<p>
是一个段落标签的开始,</p>
是一个段落标签的结束。在这两个标签之间的内容是一个段落。
<p>这是一个段落。</p>
常见的HTML标签
以下是一些常见的HTML标签:
<h1>
到<h6>
:定义标题,<h1>
是最大的标题,<h6>
是最小的标题。<p>
:定义段落。<a>
:定义超链接。<img>
:定义图像。<ul>
:定义无序列表。<ol>
:定义有序列表。<li>
:定义列表项目。<div>
:定义文档中的区段(division/section)。<span>
:定义文档中的行内元素。<table>
:定义表格。
HTML属性
HTML标签可以有属性,属性提供了关于元素的额外信息。属性总是在HTML元素的开始标签中指定,常常以名称/值对的形式出现,如:name="value"
。
以下是一些常见的HTML属性:
class
:为HTML元素定义一个或多个类名(classname)(类名从样式文件引入)id
:定义元素的唯一idsrc
:定义嵌入内容的资源(URL)。常用于img
标签,指定图像的来源URL。href
:定义链接的目标URL。常用于a
标签,创建一个指向其他网页的链接。alt
:定义图像的替代文本。如果图像无法显示,将显示此属性的值。
以下是使用属性的一个例子:
<a href="https://www.example.com">这是一个链接</a>
在上述例子中,<a>
标签定义了一个链接,href
属性指定了链接的目标URL。
HTML和CSS的学习是一个过程,通过不断的实践和应用,你将逐步掌握这些知识。在开始网络爬虫的学习之前,对HTML有基本的理解是非常有帮助的,因为你将经常需要解析HTML文档来提取信息。
推荐阅读: