随笔分类 - python-爬取网页
摘要:""" 反反爬 -- driver.get(网页) -- 人工登录后关闭程序 -- driver.get(网页) """ # 1. 普通浏览器:不能记录登录信息,容易触发反爬机制 # from selenium.webdriver import Chrome # # with Chrome() as
阅读全文
摘要:from selenium.webdriver import Chrome, ChromeOptions from selenium.webdriver.common.by import By import time option = ChromeOptions() option.add_argum
阅读全文
摘要:from selenium.webdriver import Chrome, ChromeOptions from selenium.webdriver.common.by import By import time # 不打开浏览器页面 option = ChromeOptions() optio
阅读全文
摘要:from selenium.webdriver import Chrome from selenium.webdriver.common.by import By from selenium.webdriver.common.keys import Keys import time with Chr
阅读全文
摘要:from selenium.webdriver import Chrome from selenium.webdriver.common.by import By from selenium.webdriver.common.keys import Keys import time with Chr
阅读全文
摘要:from selenium.webdriver import Chrome from selenium.webdriver.common.by import By with Chrome() as driver: list_novel = [] driver.get("https://top.bai
阅读全文
摘要:爬虫简介 网络蜘蛛,网络机器人,抓取网络数据的程序 其实就是用Python程序模仿人点击浏览器并访问网站,而且模仿的越逼真越好 目的 公司业务所需数据 公司项目测试数据 法律法规 爬取的属于开放数据不能涉及个人信息或商业机密 没有侵入性,不破坏网站正常运行(不能频繁爬取导致网站瘫痪) 没有实质性替代
阅读全文