1.2HTML及其局限
要学好XML,首先应学习与了解HTML.MICROSOFT公司总裁比尔.盖茨在多年前曾经说过"HTML是我们的数据类型".这句话预示了HTML的发展前景.今天,互联网最初用以表达信息的语言HTML已经获得了极大的成功.无论是公司,政府机构还是个人网页设计者都已从中获益.由此看来,HTML完全可以解决网络信息表示和交换的绝大部分问题了,但是,一些独具慧眼的人却已经认识到有必要重新开发一种新的标记语言.
HTML提供了一组固定的,预先定义好的元素标记,用来标注一般用途的网页元素.常用的元素包括:标题,段落,列表,表格,图片,超链接等,HTML在创建 普通网页时效果良好,大多数网页的代码都是由HTML标记的内容构成的.人们在上网浏览某个网页时,频谱际上是将该网页所对应在的HTML文档下载到本地计算机中,再由浏览器软件对其进行解释和显示.
HTML是一种颇为结构化的网页内容 标记语言,使用各种不同的HTML标记符号来分别标识和设定不同的网页元素,这样的网页元素被称为HTML元素.每个元素通常由开始标记(start tag),结束标记(end tag),以及夹在这两个标记中的内容所组成.元素的开始标记和结束标记的名称(元素标记的名称也就是此种元素的名称).并且都需要用一对尖括号<>括起来,只是在结束标记的前面多了一个斜杠符号"/"
许多HTML元素的开始标记中还允许加入若干个相关的属性,用以进一步对该元素的特征进行说明或限定.通常 用"属性名称=属性值"的方式来设定某个元素的属性,属性值可以用半角的单引号或双引号,也可以省略,例如将图像元素<IMG>的来源属性SRC设一品锅为LOGO.GIF文档,就可以使用<IMG SRC="LOGO.GIF">或者的形式,在一个元素开始瓢避,对各个属性设置的前后顺序是可以任意的.
<HTML>元素是HTML文档的最高层元素,原则上用它来指出HTML文档的开始与结束,在<HTML>元素内部通常有<HEAD>和<BODY>两在元素,其他的元素都被嵌套在这两个元素之中.
<HEAD>元素用来标识贩头部,通常是向浏览器提花一些识别或被 充的信息的,例如高密度 面的标题,关键字,页面作者,制用工具等信息,而浏览器不会把这些信息显示在网页中,理论上在<HEAD>元素中至少必须包括<TITLE>元素,便在实际上并没有严格的限定.
<TITLE>元素用来指定浏览器所要显示的标题文字,原则上不应该省略,因为它还有其他用途.例始作为页面的标签,或被当作搜索引擎录找的索引信息.
<BODY>元素用来标识HTML文档的主体部分,它中间的内容即是需要显示在浏览器窗口中的各种网页元素.
下面是关于书写HTML文档时报几点说明:
HTML文档的内容是不区分字母大小定的,包括元素的标记名称和属性名称等
对于HTML文档的连续的空格,[TAB]键或[ENTER]键,浏览器会将其当成一个空格,除非它们被置于一个等定的<PRE>元素之内
在一个元素的开始标识中,元素名称及其各个属性名称之间应该以空格,[TAB]键或地[ENTER]键隔开,因此某个元素的内容可能 会跨越数行,而浏览器只认家<与>记号
可以使用<!--和-->标记将HTML文档中的注解内容 括起来,浏览器对此种注释内容不予于处理和显示
对于HTML文档中的错误元素及其属性,浏览器将会跳过它而不予理会.
各元素之间的关系可以是嵌,但不能是交错的.
1.2.3HTML文档常用标记
要学好XML,首先要学习HTML,要熟悉HTML的文档格式及各种常用坊,在上面的包含了多种HTML元素标记常的HTML标记及其功能如表
标记 | 标记功能 |
HTML | 标识整个网页文档 |
HEAD | 标识网页头部 |
TITLE | 标识网页标题内容,此内容浏览器的标题栏中 |
BODY | 标识网页的主体部分 |
H1 | 标识第一级标题文字 |
H2 | 标识第二级标题文字 |
H3 | 标识第三级标题文字 |
TABLE | 标识一个表格 |
TR | 标识表格中的一行 |
TH | 标识表格标题行中的一个单元格内容 |
TD | 标识表格数据行中的一个单元格内容 |
UL | 设定项目列表(无面呈序编号的列表) |
OL | 设定项目列表(有顺序编号的列表) |
LI | 标识列表中的一个项目(列表项目) |
P | 标识一个文字段落 |
IMG | 标识一个图像 |
A | 标识链接到其他位置或其他网页的超链接 |
FONT | 标识文字的字体,字号与颜色 |
EM | 标识一个加强显示的斜体文字区块 |
B | 标识一个粗体文字区块 |
浏览器能识别出HTML网页中的每一个合法的HTML元素中,并且知道应该如何在浏览器中安排与显示 它们,例如浏览通常会以最大字型来显示标记为H1的一级标题文字
以较小的字型来显示标记为<H2>的二驵标题文字,以及用更小的字型来显示标记为<P>的文字段落内容,又如,浏览器会将包含在无序列表村沪<UL>中的每一个LI元素以实心园.作为其项目符号,并以缩进的段落来显示其内容,会将包含在有序列表标记<OL>中的每一个<LI>元素加以面呈序编号,并以缩进的段落来显示其内容,再如,浏览器会把超链接<A>元素的内容转换成含有下划线换成含有下划线的热链接,让浏览者可以选 择并加以单击以打开所指向的网页.