摘要: 查找: 在一些数据元素中,通过一定的方法找出与给定关键字相同的数据元素的过程 列表查找(线性表查找): 从列表中查找指定的元素 输入:列表、待查找元素 输出:元素下标(未找到元素的时候一般返回None或者-1) 顺序查找(Linear_Search): def Linear_search(li, v 阅读全文
posted @ 2020-01-27 20:01 我和姚明一样高 阅读(162) 评论(0) 推荐(0) 编辑
摘要: 用到selenium中的execute_script(js) def get_page(): time.sleep(3) for i in range(200): # 3.要下拉滚动条,搜索解决 js = "var q=document.documentElement.scrollTop={}".f 阅读全文
posted @ 2020-01-22 15:04 我和姚明一样高 阅读(251) 评论(0) 推荐(0) 编辑
摘要: Python中有很多运算符,今天我们就来讲讲is和==两种运算符在应用上的本质区别是什么。 在讲is和==这两种运算符区别之前,首先要知道Python中对象包含的三个基本要素,分别是:id(身份标识)、type(数据类型)和value(值)。 1、 is 也叫 同一性运算符,这个运算符比较判断的是对 阅读全文
posted @ 2020-01-16 15:29 我和姚明一样高 阅读(240) 评论(0) 推荐(0) 编辑
摘要: 一.纯 and 和 or 语句 1. 在纯and语句中,如果每一个表达式都不是假的话,那么返回最后一个,(原理来说)因为需要一直匹配直到最后一个。如果有一个是假,那么返回假 1 and 3 and 2 and 4 输出4 2. 在纯or语句中,只要有一个表达式不是假的话,那么就返回这个表达式的值。只 阅读全文
posted @ 2020-01-16 14:42 我和姚明一样高 阅读(320) 评论(0) 推荐(0) 编辑
摘要: python+selenium+Chromedriver使用location定位元素坐标偏差使用xpath定位元素,用.location获取坐标值,截取网页截图的一部分出现偏差。 之所以会出现这个坐标偏差是因为windows系统下电脑设置的显示缩放比例造成的,location获取的坐标是按显示100 阅读全文
posted @ 2020-01-16 14:13 我和姚明一样高 阅读(548) 评论(0) 推荐(0) 编辑
摘要: 使用execjs 解析抓取的网页数据时,报错:Could not find an available JavaScript runtime pip install pyPyExecjs 安装 解决方案: 下载:wget https://nodejs.org/dist/v8.11.4/node-v8. 阅读全文
posted @ 2020-01-14 11:55 我和姚明一样高 阅读(4267) 评论(0) 推荐(0) 编辑
摘要: 解决:定义一个就行 var window = {}; 然后再看它读了window的哪些属性 都补上就行 阅读全文
posted @ 2020-01-14 11:54 我和姚明一样高 阅读(2612) 评论(0) 推荐(0) 编辑
摘要: 问题如下: 问题:爬取头条时候发现22分钟前指的是当前时间减去22分钟那就是帖子发表时间 这里需要用到time模块,re正则模块: 实现流程: 先正则匹配数字然后将数字转化为秒,例如‘一天前’就转化为1*60*60*24 秒 以此类推。。。,最后想相差值减去就知道了正确时间 time.time() 阅读全文
posted @ 2020-01-14 10:19 我和姚明一样高 阅读(289) 评论(0) 推荐(0) 编辑
摘要: 现在开始,进入百度翻译页面 先说一下我们的目的: 获取这串json数据 F12进去发现,有两个很明显的请求连接 (图中已标识) 首先先来看输入语言检测api 很明显就是向这个地址发起Post请求,然后自动检测输入语言类别. 好戏现在开始! 很明显我们要开始处理百度翻译接口。 问题1: 我们看到这里的 阅读全文
posted @ 2020-01-09 10:21 我和姚明一样高 阅读(583) 评论(0) 推荐(0) 编辑
摘要: 要求: 1、题目、url、作者、相对时间以及评论数量 2、存入mongoDB 3、模拟Chrome下拉异步加载新闻 4、相对时间的转换(1分钟前。。。。。) 连接mongoDB,设置数据库名和集合名 实例化Chrome,隐式等待5秒,点击科技新闻 execue_script 加载js命令运行,两个循 阅读全文
posted @ 2020-01-08 11:13 我和姚明一样高 阅读(1014) 评论(0) 推荐(0) 编辑