简单介绍下gbk和utf-8这两种编码的区别
我们在本周python123的作业中出现了一种新的编码‘encoding='gbk’',我们之前常用的是编码是'encoding='utf-8''。
那么gbk与utf-8之间有什么区别呢?首先简单介绍一下gbk编码和utf-8编码。
gbk编码:是指中国的中文字符,其它它包含了简体中文与繁体中文字符,另外还有一种字符“gb2312”,这种字符仅能存储简体中文字符。
utf-8编码:它是一种全国家通过的一种编码,如果你的网站涉及到多个国家的语言,那么建议你选择UTF-8编码。
区别:
utf-8编码包含全世界所有国家需要用的字符,它比较灵活,长度在1-6个字节,utf-8编码格式很强大,支持所有国家的语言,正是因为它的强大,才会导致它占用的空间大小要比gbk大,对于网站打开速度而言,也是有一定影响的。
gbk编码主要用中文编码,包含全部中文字符,gbk的长度为2个字节,所以和gbk相比,utf-8会占用更多的数据库储存空间。对于gbk编码格式,虽然它的功能少,仅限于中文字符,但它所占用的空间大小会随着它的功能而减少,打开网页的速度比较快。
如果有同学知道更多关于它们之间的区别的话,可以进行补充说明。