摘要: requests模块 Requests模块 get方法请求 整体演示一下: 我们可以看出response使用起来确实非常方便,这里有个问题需要注意一下:很多情况下的网站如果直接response.text会出现乱码的问题,所以这个使用response.content这样返回的数据格式其实是二进制格式, 阅读全文
posted @ 2018-07-14 18:57 dandyzhang 阅读(1845) 评论(0) 推荐(0) 编辑
摘要: 什么是爬虫? 爬虫可以做什么? 爬虫的本质 爬虫的基本流程 什么是request&response 爬取到数据该怎么办 什么是爬虫? 网络爬虫(又被称为网页蜘蛛,网络机器人,在FOAF社区中间,更经常的称为网页追逐者),是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本。另外一些不常使用的名字 阅读全文
posted @ 2018-07-14 15:00 dandyzhang 阅读(18271) 评论(0) 推荐(0) 编辑
摘要: ubuntu 端口使用查看 杀死进程 设置开机启动(在此文件内添加) 阅读全文
posted @ 2018-07-14 14:22 dandyzhang 阅读(174) 评论(0) 推荐(0) 编辑