摘要: 编码 编码目的是让机器读懂语言 在python中,Python接受的是str 即使输入的数据是其它格式,在Python内部都会自动转为str 编码集 因为电脑是根据二进制工作的,所以将二进制与每个字符对应起来形成一张表使得人类的语言能够让计算机读懂。例:ASCII集 ASCII编码集 只考虑到英语世 阅读全文
posted @ 2023-02-03 22:49 小谢继续学 阅读(74) 评论(0) 推荐(0) 编辑
摘要: 爬虫概述 获取网页并提取和保存信息的自动化程序 1、获取网页 urllib、requests等库 向网站的服务器发送一个请求,服务器返回网页源码 2、提取信息 分析源代码,从中提取我们需要的数据 通用方法:正则表达式 根据网页结构提取信息:Beautiful Soup、pyquery、lxml等 3 阅读全文
posted @ 2023-02-03 12:04 小谢继续学 阅读(23) 评论(0) 推荐(0) 编辑