随笔分类 -  python-爬取网页

摘要:""" 反反爬 -- driver.get(网页) -- 人工登录后关闭程序 -- driver.get(网页) """ # 1. 普通浏览器:不能记录登录信息,容易触发反爬机制 # from selenium.webdriver import Chrome # # with Chrome() as 阅读全文
posted @ 2022-11-29 22:37 跃动指尖 编辑
摘要:from selenium.webdriver import Chrome, ChromeOptions from selenium.webdriver.common.by import By import time option = ChromeOptions() option.add_argum 阅读全文
posted @ 2022-11-29 22:24 跃动指尖 编辑
摘要:from selenium.webdriver import Chrome, ChromeOptions from selenium.webdriver.common.by import By import time # 不打开浏览器页面 option = ChromeOptions() optio 阅读全文
posted @ 2022-11-29 22:21 跃动指尖 编辑
摘要:from selenium.webdriver import Chrome from selenium.webdriver.common.by import By from selenium.webdriver.common.keys import Keys import time with Chr 阅读全文
posted @ 2022-11-29 22:11 跃动指尖 编辑
摘要:from selenium.webdriver import Chrome from selenium.webdriver.common.by import By from selenium.webdriver.common.keys import Keys import time with Chr 阅读全文
posted @ 2022-11-29 22:06 跃动指尖 编辑
摘要:from selenium.webdriver import Chrome from selenium.webdriver.common.by import By with Chrome() as driver: list_novel = [] driver.get("https://top.bai 阅读全文
posted @ 2022-11-28 21:51 跃动指尖 编辑
摘要:爬虫简介 网络蜘蛛,网络机器人,抓取网络数据的程序 其实就是用Python程序模仿人点击浏览器并访问网站,而且模仿的越逼真越好 目的 公司业务所需数据 公司项目测试数据 法律法规 爬取的属于开放数据不能涉及个人信息或商业机密 没有侵入性,不破坏网站正常运行(不能频繁爬取导致网站瘫痪) 没有实质性替代 阅读全文
posted @ 2022-11-28 20:35 跃动指尖 编辑

点击右上角即可分享
微信分享提示