摘要: 学习参考:Python3网络爬虫开发实战 问题:requests抓取的页面信息和浏览器中看到的不一样。 原因:requests获取的都是原始的HTML文档,浏览器中的页面很多都是经过javascript数据处理后的结果,这些数据可能通过AJax加载的,也可能是通过其他特定算法计算得到的 解决:对于通 阅读全文
posted @ 2019-07-04 17:20 zheng1076 阅读(7421) 评论(1) 推荐(2) 编辑
摘要: 参考:Python3网络爬虫开发实战 数据存储类型:TXT、 JSON、 csv、MySql、MongoDB、Redis 5.1 文件存储 5.1 文件存储 5.1 文件存储 5.1 文件存储 获取知乎发现页面下面的热门话题 import requests from pyquery import P 阅读全文
posted @ 2019-07-04 15:30 zheng1076 阅读(1492) 评论(0) 推荐(0) 编辑