python知识点(爬虫)

网络爬虫:
网站

  按渲染方式

        服务端渲染

              基础库

                  urllib---原生底层库

                  urllib3---相比urllib增加特性

                  httplib2---基础请求库

                  pycurl---libcurl的python实现

                  hyper---支持HTTP2新特性

              封装库

                  requests---基于urllib3简单易用

                  grab---基于urllib3及PyQuery封装

                  MechanicalSoup---基于requests和BeautifulSoup封装

        客户端渲染

              寻找Ajax请求

              模拟浏览器

              模拟JavaScript

  按同步异步
app

posted @ 2019-02-28 10:40  苏乞儿①风清扬  阅读(188)  评论(0编辑  收藏  举报