selenium 自动填报工作平台表单 安装配置篇1
把我学习selenium的过程写出来,可能比较乱 我还留了一份在B站上 up主:随性人啊
因为B站专栏,不是很友好,不能提交后持续修改,所以我把这份随时更新的放在了这里
引用:英文教程:
https://selenium-python.readthedocs.io/installation.html#downloading-python-bindings-for-selenium
安装:
引用:http://www.selenium.org.cn/1203.html
安装方式
windows修改环境变量
参考这篇,windows我用的是python3.4.4
https://jingyan.baidu.com/article/b24f6c82cba6dc86bfe5da9f.html
我是3.4版本,所以我在后面加入的是 ;C:\python34 (前提是你没设置Path,如果设置了需要修改比如python27当时我修改过,所以改动数字27变为34就好了)
过一会就安装好了
但是安装到哪里了!
检查安装结果:
可以看到安装到python27里面了
这不是我们想要的地方,我们要下载到python34版本里
https://jingyan.baidu.com/article/466506583fec5af549e5f825.html
这是安装到特定地方的
方法一:找到python34的Scripts里面的pip.exe 拖动到终端,然后再后面加上 install selenium
https://www.zhihu.com/question/21653286
方法2 直接加参数 如下图,因为我使用方法一下载了,所以这次提示我已经有了
mac版本安装selenium
环境变量设置
https://jingyan.baidu.com/article/ff411625c82a0312e4823799.html
查看当前变量
代码查看当前变量设置
我默认打开的是anaconda!所以我下载的也在这里
anaconda
在我的环境environment里面已经有了
当时我在终端直接下载
和这个代码一样,就安装了,也可以直接在anaconda里面搜索,然后安装就行了
好了,这一步完工,这下我们要安装chrome浏览器的驱动
windows是:
我的是64位电脑(https://jingyan.baidu.com/article/fedf073788c86b35ac89778b.html)悲剧了,怎么办!!
There is no separate 64-bit version of Chromedriver. The version available athttps://sites.google.com/a/chromium.org/chromedriver/downloads works on both 32 and 64-bit Windows, against either 32-or 64-bit Chrome.
我擦,看了(https://stackoverflow.com/questions/23081507/where-to-find-64-bit-version-of-chromedriver-exe-for-selenium-webdriver)智商捉急了,原来chrome没有64位,drive都可以用
mac
https://sites.google.com/a/chromium.org/chromedriver/downloads下载地址 应该是要科学上网的
查chrome版本
直接复制到chrome上面 chrome://settings/help 回车就可以看版本了
https://sites.google.com/a/chromium.org/chromedriver/downloads按照地址对应的版本区间下载驱动
mac版本
引用地址:http://blog.csdn.net/qq_33348497/article/details/77851623
2. 将解压的chromedriver移动到/usr/local/bin目录下
使用spotlight进入/usr/local/bin 拖入 如果移动不了 (https://jingyan.baidu.com/article/fdbd4277f1d5dcb89f3f485c.html)
用复制命令
sudo cp 你的文件名 /usr/local/bin/
(这里先要cd到当前下载文件的那个目录下)
移动完成
IE:
需要把IE里的保护模式都选上或都勾掉就可以了
Firefox:
https://github.com/mozilla/geckodriver/releases 最新的驱动可以使用最新的火狐浏览器系统
使用spotlight,进入
进入环境变量地址
把geckodriver拖入 文件bin里面
完工。
我们开始为工作时候,出现的重复填写表单问题找一些办法
我们打开anaconda,使用里面的spider,本来想用jupyter结果一直启动不起来,所以我只好使用spider
代码一定要加上地址,或者你可以把他放进你的环境变量里
因为我出错了好几次,老实说我没配置地址,所以我查了 Stack Overflow 说得很好,试了一下,成功了,很开心
from selenium import webdriver
import time
driver = webdriver.Firefox(executable_path = '/usr/local/bin/geckodriver')
driver.get("http://www.baidu.com")
time.sleep(3)
driver.quit()
这里我们是让火狐打开百度,3秒后关闭浏览器,如果可以那就说明你的配置完成
看到了吗,在spyider右边有个新出来firefox图标,点开就是这个画面,当然我设置了13秒,好让我截图,你可以设置短点,可以看效果