随笔分类 - 爬虫
摘要:scrapy介绍和安装 爬虫框架scrapy,在固定位置写固定代码,就能完成爬虫的功能 # 安装: -pip3 install scrapy (mac,linux) -win:看人品 1、pip3 install wheel #安装后,便支持通过wheel文件安装软件,wheel文件官网:https
阅读全文
摘要:selenium基本使用 由于requests不能执行js,有的页面内容,我们在浏览器中可以看到,但是请求下来没有 》selenium模块:模拟操作浏览器,完成人的行为。 selenium最初是一个自动化测试工具,而爬虫中使用它主要是为了解决requests无法直接执行JavaScript代码的问题
阅读全文
摘要:爬虫介绍 # 大部分软件,cs,bs,主流都是用http协议通信,模拟发送http请求 服务端把数据返回(html,xml,json) 数据的清洗(re,bs4) 入库(文件,mysql,redis,es,mongo) -mysql:tcp自定定制的协议 -redis:tcp自定定制的协议 -doc
阅读全文