06 2020 档案

该文被密码保护。
posted @ 2020-06-12 22:48 牛公的跑奔 阅读(2) 评论(0) 推荐(0) 编辑
摘要:一、切换页面 有时候窗口中有许多子tab页面。这时候肯定是需要进行切换的。selenium提供了一个叫做switch_to.window来进行切换,具体切换到哪个页面,可以从driver.window_handles中找到。 1 from selenium import webdriver 2 3 阅读全文
posted @ 2020-06-11 16:59 牛公的跑奔 阅读(697) 评论(0) 推荐(0) 编辑
摘要:一、操作cookie 1 from selenium import webdriver 2 3 driver_path = 'D:\chromedriver\chromedriver.exe' 4 driver = webdriver.Chrome(executable_path=driver_pa 阅读全文
posted @ 2020-06-11 15:58 牛公的跑奔 阅读(289) 评论(0) 推荐(0) 编辑
摘要:有时候在页面的操作很多,那么这时候可以使用行为链类ActionChains类完成。比如 现在要将鼠标移动到某个元素上并执行点击事件。 1 from selenium import webdriver 2 from selenium.webdriver.common.action_chains imp 阅读全文
posted @ 2020-06-11 15:03 牛公的跑奔 阅读(346) 评论(0) 推荐(0) 编辑
摘要:一、常见的定位元素方法 1 from selenium import webdriver 2 from selenium.webdriver.common.by import By 3 driver_path = 'D:\chromedriver\chromedriver.exe' 4 driver 阅读全文
posted @ 2020-06-11 14:46 牛公的跑奔 阅读(468) 评论(0) 推荐(0) 编辑
摘要:在爬取一些网页的时候,会发现网页的有些内容是通过JS动态加载的,也就是说是ajax数据,如下图。整个如果需要查看更多的文章,就需要【阅读更多】按钮,这时页面就会加载更多的文章,但是此时网页的网址是不会改变的,没有类似page这种表示页数的参数。这种加载方式就是ajax数据。这种数据通过普通的爬虫是获 阅读全文
posted @ 2020-06-11 12:32 牛公的跑奔 阅读(637) 评论(0) 推荐(0) 编辑
该文被密码保护。
posted @ 2020-06-07 16:32 牛公的跑奔 阅读(1) 评论(0) 推荐(0) 编辑
摘要:其中,put和get函数都一个block参数,默认为ture。表示如果队列中为满或者空,那么就会一直阻塞,直到队列可操作。 1 import threading,time 2 from queue import Queue 3 4 def set_value(q): 5 index = 0 6 wh 阅读全文
posted @ 2020-06-07 14:53 牛公的跑奔 阅读(484) 评论(0) 推荐(0) 编辑
摘要:1 import threading 2 import time 3 def coding(): 4 for i in range(3): 5 print('输入代码%s' %i) 6 time.sleep(1) 7 def drawing(): 8 for i in range(3): 9 pri 阅读全文
posted @ 2020-06-07 11:31 牛公的跑奔 阅读(128) 评论(0) 推荐(0) 编辑
摘要:要将一个scrapy项目变为一个scrapy.redis项目只需要修改下面三点就可以了: 将爬虫类从scrapy.Spider 变成scrapy_redis.spiders.RedisSpider;或者从scripy.CrawlSpider变成scrapy_redis.spiders.RedisCr 阅读全文
posted @ 2020-06-02 11:44 牛公的跑奔 阅读(339) 评论(0) 推荐(0) 编辑

总访问量:AmazingCounters.com