一、Selenium请求库

1、什么是selenium?

selenium是一个自动测试工具,它可以帮我通过代码

去实现驱动浏览器自动执行相应的操作。

所以我们也可以用它来做爬虫。

 

2、为什么要使用selenium?

主要使用selenium的目的是为了跳过登录验证。

 

3、安装与使用

——下载驱动器:

http://npm.taobao.org/mirrors/chromedriver/2.38/

 

from pip._vendor.six.moves.urllib import parse as urllib_parse


class Index(object):
    def __init__(self, url):
        self.url = url
        self.netloc = urllib_parse.urlsplit(url).netloc
        self.simple_url = self.url_to_path('simple')
        self.pypi_url = self.url_to_path('pypi')
        self.pip_json_url = self.url_to_path('pypi/pip/json')

    def url_to_path(self, path):
        return urllib_parse.urljoin(self.url, path)


PyPI = Index('https://pypi.tuna.tsinghua.edu.cn/simple')