HTML | HTML字符编码
-
计算机对数据的操作:
- 存储时,对数据进行:编码。
- 读取时,对数据进行:解码。
-
编码、解码,会遵循一定的规范 —— 字符集。
-
字符集有很多中,常见的有(了解):
ASCII
:大写字母、小写字母、数字、一些符号,共计128个。
ISO 8859-1
:在 ASCII 基础上,扩充了一些希腊字符等,共计是256个。
GB2312
:继续扩充,收录了 6763 个常用汉字、682个字符。
GBK
:收录了的汉字和符号达到 20000+ ,支持繁体中文。
UTF-8
:包含世界上所有语言的:所有文字与符号。—— 很常用。
- 使用原则是怎样的?
原则1:存储时,务必采用合适的字符编码 。
否则:无法存储,数据会丢失!
原则2:存储时采用哪种方式编码 ,读取时就采用哪种方式解码。
否则:数据错乱(乱码)!
例如下面文字中,包含有:中文、英文、泰文、缅甸文
我爱你 I love you! ฉนรกเธอนะ ကȁနမက ချစတယ။
若使用
ISO8859-1
编码存储,在存入的那一刻,就出问题了,因为ISO8859-1
仅支持英文!为保证所有的输入,都能正常存储和读取,现在几乎全都采用:
UFT-8
编码。所以我们编写
html
文件时,也都统一用UFT-8
编码。
-
总结:
-
平时编写代码时,统一采用
UTF-8
编码(最稳妥)。 -
为了让浏览器在渲染
html
文件时,不犯错误,可以通过meta
标签配合charset
属性指定字符编码。<head> <meta charset="UTF-8"/> </head>
-