05 2018 档案
摘要:with如何工作?
阅读全文
摘要:背景 对于电商类型和内容服务类型的网站,经常会出现因为配置错误造成页面链接无法访问的情况(404)。 显然,要确保网站中的所有链接都具有可访问性,通过人工进行检测肯定是不现实的,常用的做法是使用爬虫技术定期对网站进行资源爬取,及时发现访问异常的链接。 对于网络爬虫,当前市面上已经存在大量的开源项目和
阅读全文
摘要:推荐一些其他的资源,爬虫相关 大话爬虫的基本套路 Puppeteer之爬虫入门 利用爬虫技术能做到哪些很酷很有趣很有用的事情? Web网页爬虫对抗指南 Part.1 如何学习python爬虫 各种爬虫实例, 强烈推荐
阅读全文
摘要:为什么要进行爬虫对抗? 知己知彼,百战不殆。 爬虫往往会爬取其他服务的一些核心资源,这些资源是服务提供商重点保护的资产,所以很多网站都会启用一些反爬虫策略。 这里我们简单分析一下反爬虫的常用手段。 监控后台日志和流量模式; 如果发现异常活动,则限制访问 通过日志是可以看出一些异常访问的,比如例如来自
阅读全文
摘要:在V2EX主页的右侧有个最热主题区域,里面列出了当日的热门讨论话题。使用爬虫技术获取这些热门主题文本和链接。 注意:v2ex本身提供了接口去获取这些热门主题的详细信息,本节内容只是举例,并不是最佳实践 具体步骤 访问v2ex主页,获取html文本 分析html文本,找出待获取内容的特征 解析html
阅读全文
摘要:最近看下爬虫方面,用一些通用的做一些小的实验。都是比较基础的代码,高手请跳过。 说明 这里只是实现获取知乎每日/每月最热问题的一个基本的小功能(https://www.zhihu.com/explore) 具体步骤 访问知乎的发现主页,获取html文本分析html文本,找出今日最热和本月最热的htm
阅读全文
摘要:很多人不知道产品经理有哪些要求,其实基础的能力要求,大家可以看看下面: 一.产品能力模型 二.能力模型进阶 PART1 解构互联网产品经理 产品经理的前世今生 传统行业与产品经理的关系与区别 产品经理的工作职责、能力模型及产品思维(以某大型大厂内部考核体系为例) 产品经理典型任务、常用工具及文档规范
阅读全文
摘要:另一份时序图:https://www.cnblogs.com/haochuang/p/9092663.html 在线画个轻量级时序图:https://www.cnblogs.com/haochuang/p/8953940.html 关于简测试相关流程,我大致做了两份,一个基本流程,一个异常处理流程;
阅读全文
摘要:一个不错的Github站点:https://github.com/b3log 搜集整理的免费的以太坊技术资料,都放百度云盘了: 以太坊官方文档中文版 以太坊白皮书中文版 web3.js API 文档中文版 solidity 官方文档中文版 truffle 官方文档中文版 geth 使用指南中文版 区
阅读全文
摘要:手机APP项目测试点(内容)总结 对于手机项目(应用软件),主要是进行系统测试。 而针对手机应用软件的系统测试,我们通常从如下几个角度开展测试工作: 功能模块测试 交叉事件测试 性能测试 安全测试 容量测试 兼容性测试 接口测试 易用性/用户体验测试 硬件环境测试 安装/卸载测试 升级/更新测试 1
阅读全文
摘要:这里先零散记录一下,后续逐渐再完整整理。 远程scp无密码登录 假设有两台服务器,A是Jenkins构建服务器,B是应用服务器,A构建好应用之后,将包传到B进行发布。 在A上面执行 ssh-keygen -t rsa -P '', -P后面两个单引号表示密码为空 我的操作记录与部分截图: 只直接执行
阅读全文
摘要:启用EPEL存储库 RHEL/CentOS 7 64位: RHEL/CentOS 6 32位: CentOS 7 不支持 32位 EPEL 存储库,所以用,RHEL/CentOS 6 32位的。 安装 git 命令
阅读全文
摘要:在歌曲/歌单页面下,点击“生成外链播放器”(网易)、“转帖”(虾米)就可以看到歌曲的HTML代码了。这里以歌曲 Echo 为例,展示下两种不同播放器的区别。 或者增加虾米音乐: 值得注意的是,虾米使用的是 embed 而网易云则是 iframe,而 iframe 有个很大的毛病,这个网易云也有提示—
阅读全文
摘要:问题如下: 解决办法: 提示chrome driver没有放置在正确的路径下,于是下载chrome dirver,然后放置到/usr/bin的目录下,再次运行就OK了! 需要根据自己的chrome浏览器版本,来下载对应版本相应包,我的版本师62,所以下载2.35版本,如下: https://chro
阅读全文
摘要:使用Pycharm,遇到unresolved reference的解决办法 在编程过程中,遇到很多错误,提示都是unresolved reference。 问题原因:Pycharm默认该项目的根目录为source目录,每次import都是从source目录开始查找 解决步骤: 在进行问题排查后,从s
阅读全文
摘要:一次断电,导致实体机关机了,虚拟机也连不上去,只好手动来起来。 我想增加一下自启动,让硬件开机的时候,自动启动虚拟机; 其实是有办法的,尝试了一下,也成功了,这里简单标记下。 要想停止开机自启动 注意:上面的dev是机器名称,看下下面截图,就明白了。 当然,virsh有很多命令可用,一般help基本
阅读全文
摘要:一。中国风样式: 参考:https://www.cnblogs.com/keerdi/p/6141461.html 样式: 二.添加打赏码 参考:https://www.cnblogs.com/mq0036/p/7048716.html 求打赏的签名吧,支付宝求打赏签名测试代码: 在设置页面的左边菜
阅读全文
摘要:准备即可博客css样式,以后可以换换在调整调整,需要的同学可以直接拿去用,页面风格样式如下文。 另外,css代码可以在线格式化:http://tool.oschina.net/codeformat/css,感谢开源中国。 操作方法,这里有:https://www.jianshu.com/p/23b2
阅读全文
摘要:下午对博客做了一点小的优化,调整了以往的样式。 codes 如下: 待优化
阅读全文
摘要:见识到一个新工具,markdown写ppt,支持多平台:https://yhatt.github.io/marp/ 看起来是一个不错的小工具,有兴趣可以尝试一下。
阅读全文
摘要:看博客园的时候,发现有的园友博客右侧都有一个:打赏控件。 但是,我看了一下,博客园自身没有这个功能。但其实,博客园是支持自定义插件的。 懂得同学基本就明白了,下面不用继续看,不清楚的,可以按照我下面的操作试一下。 下面给需要的小伙伴分享一下,整个“打赏”功能的实现:(该方法比较方便,不用再去下载插件
阅读全文
摘要:以前是Win+Ubuntu+黑苹果,周末想体验一下deepin,于是简单安装了一下,安装过程很简单,这里不再描述。安装之后,第一次打开系统,确实很惊艳,赏心悦目的操作系统。 之前用Ubuntu时候,Chrome、输入法,InteliJiDEA等很多开发工具,包括QQ等都需要自己安装,现在基本都自带了
阅读全文
摘要:文章摘自:http://blog.sina.com.cn/s/blog_64fb59d90102x3xa.html 部分参考:https://bbs.deepin.org/forum.php?mod=viewthread&tid=38210 如下: 先来一张镇楼照,虽然比不上一些大神,不过一些满足日
阅读全文
摘要:一.Ubuntu18.04镜像下载 官方下载地址:http://releases.ubuntu.com/18.04/ 官方64位iso下载地址:http://releases.ubuntu.com/18.04/ubuntu-18.04-desktop-amd64.iso 网易镜像下载地址:http:
阅读全文