使用selenium
1、安装谷歌浏览器
2、安装谷歌浏览器驱动
3、安装selenium包
4、测试
1、安装谷歌浏览器
2、安装谷歌浏览器驱动
检查自己的chrome浏览器版本,根据自己的浏览器版本选择对应的驱动版本,
下载之后解压之后,
Ubuntu中将驱动器文件拷贝到/usr/bin目录下
Windows中可以直接放在调用浏览器的*.py所在文件目录下
echo $PATH 查看环境变量
将驱动程序直接放到环境变量下
3、安装selenium包
用pycharm安装:
pip install selenium
安装后,
Windows中要设置webdriver.py路径的环境变量
D:\biancheng\work\crawler_py3_zzl\Lib\site-packages\selenium\webdriver\firefox
否则from selenium import webdriver找不到webdriver模块
4、测试
if __name__ == '__main__': # 创建浏览器 driver = webdriver.Chrome() # 请求url url='https://www.baidu.com/s?wd=深圳'; driver.get(url) # 保存快照 # driver.save_screenshot('baidu.png') # 常用定位 el=driver.find_element_by_id('kw') print(el.get_attribute('value'))
【selenium使用方法小结】:
# 小结: # 1、调用环境变量指定的PhantomJS浏览器创建浏览器对象 driver = webdriver.Chrome(r'D:\xxx\chromedriver.exe') # 2、get方法请求页面,获取响应 url = "https://www.baidu.com/" driver.get(url) # 3、打印标题 print(driver.title) # 4、打印登录页面的代码 html_str = driver.page_source print(html_str) # print(type(html_str)) # print(len(html_str)) # 5、根据xpath、id选择元素,并点击 baidu_click = driver.find_element_by_xpath("//div[@class='header_menu_item_body']/div[7]") # baidu_click = driver.find_element_by_id("header_menu_item_body") baidu_click.click() # 6、根据xpath、id选择元素,并填写内容 bd_searchbox = driver.find_element_by_xpath("//input[@class='input_username']") bd_searchbox.send_keys(account) # 7、提取url print(driver.find_element_by_xpath("//div[@class='title']/a/@href")) # 8、提取文本 print(driver.find_element_by_xpath("//div[@class='title']/a/text"))