2018年2月27日

摘要: bytearray类型是python中的二进制数组类型,返回一个字节数组。 byte=bytearray(str,encoding,error) str:待转化的字符串,若该值为字符串,则encoding参数必须存在(为utf-8,gbk,Latin-1等编码格式);若为b'xxx',则encodi 阅读全文

posted @ 2018-02-27 22:18 moisiet 阅读(2340) 评论(0) 推荐(0) 编辑

摘要: 一、hashlib的基本组成: 1.hashlib库是python3的标准库,主要用于数据的加密,以下是hashlib的方法及属性。 >>> import hashlib>>> dir(hashlib)['__all__', '__builtin_constructor_cache', '__bui 阅读全文

posted @ 2018-02-27 20:55 moisiet 阅读(155) 评论(0) 推荐(0) 编辑

摘要: 一、编码的两大方式: 在python3.x中,字符串编码分为unicode和bytes两大类编码方式。 直接书写s='中国人',这种方式定义的编码方式为unicode,是通用的方式。 另一种是bytes编码方式,也就是所谓的二进制编码,可以分为utf-8,gbk,latin1等方式,但它们都是二进制 阅读全文

posted @ 2018-02-27 19:49 moisiet 阅读(3883) 评论(0) 推荐(0) 编辑

摘要: lxml、beautifulsoup和正则表达式都可以解析定位html元素。前两者中,lxml比beautifulsoup效率高,所以采用lxml解析html。 方法: from lxml import html tree=html.fromstring(response.text) 此时tree是 阅读全文

posted @ 2018-02-27 17:22 moisiet 阅读(790) 评论(0) 推荐(0) 编辑