上一页 1 ··· 8 9 10 11 12 13 14 15 下一页
摘要: # -*- coding: UTF-8 - # 破解密码程序。通过循环输入账号密码尝试登录网站,并记录相关账号密码 # 目前问题:由于知识有限,第一次输入密码后,密码输入框中的数据无法清除。 # 导致输入的密码数据累积。破解时,每次需要重新打开网页,比较费时 # 待优化: # 1.尝试调用js的方法,清除输入的数据 # 2.查找资料,继续查找清除已输入的内容的方法 # 3.可以尝试采用多线程进行... 阅读全文
posted @ 2019-04-18 22:39 fjc0000 阅读(1825) 评论(0) 推荐(0) 编辑
摘要: 的 阅读全文
posted @ 2019-04-15 19:00 fjc0000 阅读(330) 评论(0) 推荐(0) 编辑
摘要: 的 阅读全文
posted @ 2019-04-15 18:59 fjc0000 阅读(143) 评论(0) 推荐(0) 编辑
摘要: pass 阅读全文
posted @ 2019-04-09 18:10 fjc0000 阅读(263) 评论(0) 推荐(0) 编辑
摘要: 心得: 1.采用selenium由于涉及到加载数据,比较缓慢,容易超时,一定要采用try语句, 2.使用的xpath搜索时,容易找不到所要的路径,需要简洁化,否认则会出现假死机现象 3.采用selenium爬虫,由于涉及到页面加载,十分缓慢,个人倾向于ajax技术。 4.由于豆瓣信息中需要获取的信息是静态的,所以可以直接使用bs4模块进行获取,不必采用selenium #from bs4 im... 阅读全文
posted @ 2019-04-09 08:58 fjc0000 阅读(570) 评论(0) 推荐(0) 编辑
摘要: 知识点: 1.按键输入,获取cookie、header等信息。 2.模拟鼠标双击、右击、拖拽甚至按住不动 1.selenium的安装 2.按键的输入 3.拖曳鼠标 阅读全文
posted @ 2019-04-02 08:23 fjc0000 阅读(2048) 评论(0) 推荐(0) 编辑
摘要: 题目:从http://movie.mtime.com中读取一个电影的票房信息和相关的同类电影。 方案一:采用Ajax技术,逐步提取动态网站的json,再进行爬虫 知识点: 1.由于该数据是动态信息,需要找到相关的json,并拼接出所需要的网址,进行爬虫。 2.利用正则表达式提取网址信息、利用json 阅读全文
posted @ 2019-03-29 17:52 fjc0000 阅读(344) 评论(0) 推荐(0) 编辑
摘要: 任务要求: 1.爬虫200万条数据 2.采用临时文件方式存储临爬虫过程积累的大量但又无用的临时数据 3.采用mongo库进行数据存储,并设置用户权限 任务方案: 阅读全文
posted @ 2019-03-27 08:49 fjc0000 阅读(239) 评论(0) 推荐(0) 编辑
摘要: 由于mongo对可以数据进行分布式存储,mongo数据库有较大的优势。 下面介绍一下其安装方法: 1.从官网https://www.mongodb.com/download-center#community下载软件,格式可以是msi,直接解压进行安装 2.安装过程可以选择dbpath,logpath 阅读全文
posted @ 2019-03-27 08:48 fjc0000 阅读(301) 评论(0) 推荐(0) 编辑
摘要: 知识点: 1.新式类和经典类的区别 2.super函数的使用 3.继承类的call调用顺序 答案1: 新式类和经典类的差异形式上是: 新式类: class A(object): pass 经典类: classA:pass 定义形式上有区别,这个在python2版本中比较明显,对于python3,加不 阅读全文
posted @ 2019-03-20 09:52 fjc0000 阅读(118) 评论(0) 推荐(0) 编辑
上一页 1 ··· 8 9 10 11 12 13 14 15 下一页