码出个世界

导航

2021年8月16日 #

python---转码遇到了非法字符的解决方法:“ignore”

摘要: 在对html response的decode时抛出,代码原样为: response = urllib.urlopen(dsturl) content = response.read().decode('utf-8') 抛出错误为 File "./unxingCrawler_p3.py", line 阅读全文

posted @ 2021-08-16 10:00 码出个世界 阅读(1030) 评论(0) 推荐(0) 编辑

字符编码中ASCII、Unicode和UTF-8的区别

摘要: 首先解释一下编码,编码是信息从一种形式或格式转换为另一种形式的过程,也称为计算机编程语言的代码简称编码。用预先规定的方法将文字、数字或其它对象编成数码,或将信息、数据转换成规定的电脉冲信号。编码在电子计算机、电视、遥控和通讯等方面广泛使用。编码是信息从一种形式或格式转换为另一种形式的过程。解码,是编 阅读全文

posted @ 2021-08-16 09:32 码出个世界 阅读(159) 评论(0) 推荐(0) 编辑

字符数是什么意思?

摘要: “字符数”包括各种语言中的单词和标点符号。一个汉字或中文标点符号通常被计算为两个字符,因为它的存储空间占用2个字节。 中文一个字符算两个字符数;中文标点也是一个字符占两个字符数,都为两个字节长度。 阅读全文

posted @ 2021-08-16 09:08 码出个世界 阅读(2384) 评论(0) 推荐(0) 编辑

浅谈字节

摘要: 字节(Byte)是计算机信息技术用于计量存储容量的一种计量单位,是二进制数据的单位。也表示一些计算机编程语言中的数据类型和语言字符 [1] 。 一个字节通常8位长,储存的数值范围为0-255。如同字元一样,字节型态的变数只需要用一个位元组(8位元)的内存空间储存。 阅读全文

posted @ 2021-08-16 08:06 码出个世界 阅读(112) 评论(0) 推荐(0) 编辑