2018年10月24日

摘要: linux 登陆与登出 关机 查看linux系统信息 linux查看用户 切换目录 cd 显示当前路径 pwd 显示文件或目录的属性 ls(dir) 文件显示颜色 用户管理 Linux下软件介绍 阅读全文

posted @ 2018-10-24 17:40 eilinge 阅读(155) 评论(0) 推荐(0) 编辑

摘要: 已经开始听喜马拉雅Fm电台有2个月,听里面的故事,感觉能听到自己,特别是蕊希电台,始于声音,陷于故事,忠于总结。感谢喜马拉雅Fm陪我度过了这2个月,应该是太爱了,然后就开始对Fm下手了。QAQ 该博客基于以下博客,提取和修改。 需要解决问题 三、先给大家看看成果 一、提取网页源码 1.1_提取tra 阅读全文

posted @ 2018-10-24 15:57 eilinge 阅读(969) 评论(0) 推荐(0) 编辑

2018年10月23日

摘要: 之前开始学习scrapy,接触了AJax异步加载。一直没放到自己博客,趁现在不忙,也准备为下一个爬虫做知识储存,就分享给大家。 还是从爬取图片开始,先上图给大家看看成果,QAQ。 一、图片加载的方法 1.1:网页源码__javascript加载数据 1.2:F12审查元素:滑动滑块,图片开始不断加载 阅读全文

posted @ 2018-10-23 18:11 eilinge 阅读(264) 评论(0) 推荐(0) 编辑

摘要: Docker的应用场景 Docker 的优点 Ubuntu Docker 安装Docker Ubuntu 16.04 安装 Docker Docker 设置代理 Docker 安装 Python 使用mongo镜像 docker常用命令 遇到的问题 阅读全文

posted @ 2018-10-23 14:56 eilinge 阅读(144) 评论(0) 推荐(0) 编辑

2018年10月22日

摘要: 今天给大家讲一下--IpProxy,由于从"http://www.xicidaili.com/nn"爬取,以下是我转载的博客 需要解决的问题 这里就给大家看看爬取的代码怎么写,其他的配置可以看我之前的博客,具体代码可以进我的GitHub:。QAQ!! 阅读全文

posted @ 2018-10-22 14:54 eilinge 阅读(149) 评论(0) 推荐(0) 编辑

2018年10月19日

摘要: 之前一直在学习关于滑块验证码的爬虫知识,最接近的当属于模拟人的行为进行鼠标移动,登录页面之后在获取了,由于一直找不到滑块验证码的原图,无法通过openCV获取当前滑块所需要移动的距离。 给大家讲了答题思路,现在就来拿实例验证一下可行性,拿自己博客开刀--"https://i.cnblogs.com" 阅读全文

posted @ 2018-10-19 17:31 eilinge 阅读(203) 评论(0) 推荐(0) 编辑

摘要: 该博客基于以下博客网站里的内容进行提取,实验,和补充。让我们开始 AutoResponder 允许拦截指定规则的请求 Composer 自定义请求发送服务器 Filters 请求过滤规则;其实大家耐着性子看,都是些简单的英语,很容易知道每个选项的功能。 备注: 阅读全文

posted @ 2018-10-19 14:27 eilinge 阅读(182) 评论(0) 推荐(0) 编辑

2018年10月18日

摘要: MongoDB 是一个基于分布式文件存储的数据库 MongoDB的基本命令 MongoDB增,删,改,查 Help() 阅读全文

posted @ 2018-10-18 15:49 eilinge 阅读(170) 评论(0) 推荐(0) 编辑

摘要: Hi,大家好。有段时间没来更新scrapy爬取实例信息了,前2天同事说爬取拉勾,boss直聘等网站信息比较困难。昨天下午开始着手爬取boss直聘内Python爬虫的信息,比想象中的简单很多。 需要解决的问题: 解决的思路: 图(1_1) 图(1_2) 老规矩,给各位爬取结果的图,大家也可以去尝试一下 阅读全文

posted @ 2018-10-18 13:47 eilinge 阅读(750) 评论(1) 推荐(0) 编辑

2018年10月17日

摘要: unit_tests.py 阅读全文

posted @ 2018-10-17 10:25 eilinge 阅读(310) 评论(0) 推荐(0) 编辑