摘要: 有两种解决方式 1.使用response.encoding = 'utf 8' 2.使用.encode('iso 8859 1').decode('gbk') 爬取美女壁纸缩略图并解决标题乱码问题 阅读全文
posted @ 2019-05-28 22:48 robertx 阅读(2972) 评论(0) 推荐(1) 编辑
摘要: 爬虫的数据解析 两种爬取图片的方法 第一种: 使用with open 保存为文件 第二种: 使用urllib模块 数据解析 常用的python数据解析有四种方式 : 正则 xpath bs4 pyquery 数据解析的原理: 标签的定位 提取标签中存储的文本数据或者标签属性中存储的数据 1.正则解析 阅读全文
posted @ 2019-05-28 22:42 robertx 阅读(340) 评论(0) 推荐(0) 编辑