会员
周边
捐助
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
hxt8
博客园
首页
新随笔
联系
订阅
管理
2019年1月10日
手机网页端查看百度等搜索引擎网页快照的方法
摘要: 在手机浏览器用百度等搜索引擎搜索时,搜索的结果是没法查看快照的。但如果某个网页打不开或者内容被删除了,往往用网页快照可能可以找到内容。那么在移动手机端如何查看到网页快照呢? 第一种方法 在想要查询的网页地址前面加上 his.sh/ (别忘记加上/),就会跳转到一个叫历史快照网的网站,会聚合显示该网页
阅读全文
posted @ 2019-01-10 23:34 hxt8
阅读(24394)
评论(0)
推荐(0)
编辑
2018年10月29日
查询淘宝京东商品历史价格的方法
摘要: 淘宝上现在是无法查看某件商品的历史价格,用户可能在商品高价格的时候购买。尤其是在双十一等促销活动期间,很多商家会先将价格调高,然后降价,实际价格根本没有便宜。因此网购时查询某件商品的历史价格很有必要。
阅读全文
posted @ 2018-10-29 20:57 hxt8
阅读(10536)
评论(0)
推荐(0)
编辑
2018年9月24日
mongodb增量或全量备份脚本
摘要: mongodb备份脚本,可以全量或增量进行备份,两年前所写,目前网上mongodb备份相关的脚本也还是很少。 功能 定期对mongodb数据库数据进行全量备份或增量备份(副本集架构),并可以压缩上传到阿里云oss(本地会先生成压缩包,可以设置不上传oss)。 脚本运行环境 使用python语言编写,
阅读全文
posted @ 2018-09-24 20:32 hxt8
阅读(6103)
评论(0)
推荐(0)
编辑
2018年8月17日
使用webpasser抓取某笑话网站整站内容
摘要: 使用webpasser框架抓取某一笑话网站整站内容。webpasser是一款可配置的爬虫框架,内置页面解析引擎,可快速配置出一个爬虫任务。先写总的抓取参数:网页编码是gbk,请求超时时间是5秒,请求失败重试5次,抓取失败后等待时间10秒,设置10个线程抓取,每次抓取后不等待。这里不设置请求头信息、cookie,代理了
阅读全文
posted @ 2018-08-17 21:49 hxt8
阅读(560)
评论(0)
推荐(0)
编辑