fjc0000

2019年4月18日

摘要： # -*- coding: UTF-8 - # 破解密码程序。通过循环输入账号密码尝试登录网站，并记录相关账号密码 # 目前问题：由于知识有限，第一次输入密码后，密码输入框中的数据无法清除。 # 导致输入的密码数据累积。破解时，每次需要重新打开网页，比较费时 # 待优化： # 1.尝试调用js的方法，清除输入的数据 # 2.查找资料，继续查找清除已输入的内容的方法 # 3.可以尝试采用多线程进行... 阅读全文

posted @ 2019-04-18 22:39 fjc0000 阅读(1825) 评论(0) 推荐(0) 编辑

2019年4月15日

python每日一题：爬取京东、淘宝中某类商品的信息

摘要：的阅读全文

posted @ 2019-04-15 19:00 fjc0000 阅读(330) 评论(0) 推荐(0) 编辑

python每日一题：爬取博客园某个人的博客数量，列出标题

摘要：的阅读全文

posted @ 2019-04-15 18:59 fjc0000 阅读(143) 评论(0) 推荐(0) 编辑

2019年4月9日

python每日一题：爬虫999查询酒店信息

摘要： pass 阅读全文

posted @ 2019-04-09 18:10 fjc0000 阅读(263) 评论(0) 推荐(0) 编辑

python每日一题：使用selenium爬虫豆瓣电影信息

摘要：心得： 1.采用selenium由于涉及到加载数据，比较缓慢，容易超时，一定要采用try语句， 2.使用的xpath搜索时，容易找不到所要的路径，需要简洁化，否认则会出现假死机现象 3.采用selenium爬虫，由于涉及到页面加载，十分缓慢，个人倾向于ajax技术。 4.由于豆瓣信息中需要获取的信息是静态的，所以可以直接使用bs4模块进行获取，不必采用selenium #from bs4 im... 阅读全文

posted @ 2019-04-09 08:58 fjc0000 阅读(570) 评论(0) 推荐(0) 编辑

2019年4月2日

python每日一题：爬虫模拟按键输入、点击等操作动态网站

摘要：知识点： 1.按键输入，获取cookie、header等信息。 2.模拟鼠标双击、右击、拖拽甚至按住不动 1.selenium的安装 2.按键的输入 3.拖曳鼠标阅读全文

posted @ 2019-04-02 08:23 fjc0000 阅读(2048) 评论(0) 推荐(0) 编辑

2019年3月29日

python每日一题：爬虫电影的动态票房信息

摘要：题目：从http://movie.mtime.com中读取一个电影的票房信息和相关的同类电影。方案一：采用Ajax技术，逐步提取动态网站的json，再进行爬虫知识点： 1.由于该数据是动态信息，需要找到相关的json，并拼接出所需要的网址，进行爬虫。 2.利用正则表达式提取网址信息、利用json 阅读全文

posted @ 2019-03-29 17:52 fjc0000 阅读(344) 评论(0) 推荐(0) 编辑

2019年3月27日

python之采用分布式爬虫200万条百科信息，并mongo存储实例

摘要：任务要求： 1.爬虫200万条数据 2.采用临时文件方式存储临爬虫过程积累的大量但又无用的临时数据 3.采用mongo库进行数据存储，并设置用户权限任务方案：阅读全文

posted @ 2019-03-27 08:49 fjc0000 阅读(239) 评论(0) 推荐(0) 编辑

python之mongo安装和账号权限知识点

摘要：由于mongo对可以数据进行分布式存储，mongo数据库有较大的优势。下面介绍一下其安装方法： 1.从官网https://www.mongodb.com/download-center#community下载软件，格式可以是msi，直接解压进行安装 2.安装过程可以选择dbpath，logpath 阅读全文

posted @ 2019-03-27 08:48 fjc0000 阅读(301) 评论(0) 推荐(0) 编辑

2019年3月20日

python之类的相关知识点

摘要：知识点： 1.新式类和经典类的区别 2.super函数的使用 3.继承类的call调用顺序答案1：新式类和经典类的差异形式上是：新式类： class A（object）： pass 经典类： classA：pass 定义形式上有区别，这个在python2版本中比较明显，对于python3，加不阅读全文

posted @ 2019-03-20 09:52 fjc0000 阅读(118) 评论(0) 推荐(0) 编辑

公告