2019年1月10日
摘要: 在手机浏览器用百度等搜索引擎搜索时,搜索的结果是没法查看快照的。但如果某个网页打不开或者内容被删除了,往往用网页快照可能可以找到内容。那么在移动手机端如何查看到网页快照呢? 第一种方法 在想要查询的网页地址前面加上 his.sh/ (别忘记加上/),就会跳转到一个叫历史快照网的网站,会聚合显示该网页 阅读全文
posted @ 2019-01-10 23:34 hxt8 阅读(24394) 评论(0) 推荐(0) 编辑
  2018年10月29日
摘要: 淘宝上现在是无法查看某件商品的历史价格,用户可能在商品高价格的时候购买。尤其是在双十一等促销活动期间,很多商家会先将价格调高,然后降价,实际价格根本没有便宜。因此网购时查询某件商品的历史价格很有必要。 阅读全文
posted @ 2018-10-29 20:57 hxt8 阅读(10536) 评论(0) 推荐(0) 编辑
  2018年9月24日
摘要: mongodb备份脚本,可以全量或增量进行备份,两年前所写,目前网上mongodb备份相关的脚本也还是很少。 功能 定期对mongodb数据库数据进行全量备份或增量备份(副本集架构),并可以压缩上传到阿里云oss(本地会先生成压缩包,可以设置不上传oss)。 脚本运行环境 使用python语言编写, 阅读全文
posted @ 2018-09-24 20:32 hxt8 阅读(6103) 评论(0) 推荐(0) 编辑
  2018年8月17日
摘要: 使用webpasser框架抓取某一笑话网站整站内容。webpasser是一款可配置的爬虫框架,内置页面解析引擎,可快速配置出一个爬虫任务。先写总的抓取参数:网页编码是gbk,请求超时时间是5秒,请求失败重试5次,抓取失败后等待时间10秒,设置10个线程抓取,每次抓取后不等待。这里不设置请求头信息、cookie,代理了 阅读全文
posted @ 2018-08-17 21:49 hxt8 阅读(560) 评论(0) 推荐(0) 编辑